不孕症临床试验数据的核查

浏览 9

不孕症大型临床试验的数据核查策略

所有临床试验都涉及到数据的收集、 核查与统 计的阶段, 这其中包含着大量数据的记录、 核查、 分 析的工作 [1] 。 想得到真实的研究结论, 这其中的每一 步都至关重要。 不孕症临床试验因其受试者人群孕 产特异性, 在数据核查阶段也有其区别与其他临床 试验的特点。

我院妇科是国家临床研究基地妇科重点病种 的的具体承担单位科室, 重点研究病种是 “多囊卵 巢综合征(polycystic ovary syndrome, PCOS) ” 。 笔 者亲自参与了我院妇科主持并已经完成的2项多中 心、 大样本项目的课题核查过程 [2-3] 。 其中, “针刺和 克罗米芬对多囊卵巢综合征无排卵妇女活产率的 影响 (PCOSAct) ” 是一项国际合作的大型随机对照 临床试验, 目的是探讨针刺联合克罗米芬对PCOS妇 女的孕产是否有更好的临床疗效, 其终点结局指标 是 “活产率” , 在全国25家医院共纳入了1 000例受 试者, 历时近4年完成试验的干预与产科重点结局 数据的收集与核查统计, 本文以该项目数据核查为 例, 将不孕症相关临床试验的核查经验与策略呈现 如下。

明确核查内容

在核查过程开始, 首先要确定需要核查的内容, 也就是从临床试验过程中采集的数据, 这些数据被 记录在纸质病例报告表(case report form, CRF) 与电 子数据库中。 为了保证科研效率, 临床试验中数据采 集不是漫无目的的, 所有数据的采集设计都要有一 定科学研究依据, 这些指标的设计都直接关系或者 间接体现到PCOS发生和发展、 PCOS的异质性、 干预 措施的有效性及安全性。

通常CRF首先要获取人口学特征, 不同人口学特 征的人群对于干预措施的反应也不相同, 进而影响 疗效评价, 是很重要的数据 [4] ; 体格参数、 既往史和 现病史, 可以帮助研究者纳入及排除患者, 同时也提 供部分基线数据, 也可用以评估疗效; 最重要的是疗 效评价指标和安全性指标, 以帮助研究者评估临床 试验中干预措施的有效性和安全性, 是临床试验的 核心问题; 此外还有时间指标, 帮助判定患者对于治 疗方案的时间依赖性关系; 还有依从性指标, 可以通 过方案偏离违反事件的发生率反映临床试验完成质 量并为优化研究方案提供证据 [5] 。

不孕症临床试验数据的核查重点与难点 数据核查实质上是检查临床研究中所采集数 据的真实性、 完整性、 准确性以及时效性 [6] : ①真实 性: 数据反映受试者的真实而不是虚假情况; ②完整 性: CRF表条目收集完整、 病例数收集完整; ③准确 性: 采集数据时保证数据的精准性以避免偏差, 能够 正确理解研究方案并熟练地掌握信息采集方法 [7] ; ④时效性: 数据必须符合方案中规定的时间限制, 避 免拖延。

1. 核查重点: 纳入、 排除标准 所有临床试验 中, 纳、 排标准的核查都是重中之重。 纳入、 排除标 准体现了诊断疾病严格性和受试人群的均一性特 点。 在随机对照临床试验中强调的是纳入同质人群, 有严格的筛选标准, 确保治疗的是目标疾病。 如本项 目要纳入的患者是月经稀发的PCOS患者, 筛选标准 是十分明确的修改版鹿特丹国际通行标准(月经稀 发或闭经, 同时合并多囊样卵巢或/和高雄激素血症 或/和临床高雄) , 如果纳入了其他病种患者或者同 一病种其他诊断标准的患者, 则干预效果的真实性 就会受到破坏, 严重干扰结论的正确性, 直接影响日 后研究结论的外推范围, 属于严重的方案违反情况, 在做符合方案分析集统计时, 需要剔除此病例。

2. 核查难点: 临床终点指标与方案依从性 在 不孕症临床试验中不仅要注意普遍性核查内容, 更 应该注意与不孕症治疗相关的特异性核查内容。 妊 娠结局体现终点指标, 包括女性生殖发育全过程的 各节点, 包括排卵、 受孕、 妊娠、 流产和活产等, 这些 指标之间的逻辑关系和时间次序, 是不孕症临床试 验核查的难点。 如, 对于活产的受试者, 之前一定有 排卵、 受孕、 妊娠; 对于生化流产的受试者, 之前一 定有排卵、 受孕, 之后没有妊娠和活产; 流产的患者 之前一定有排卵、 受孕、 妊娠, 之后没有活产。 一旦有 些受试者的数据出现了不符合以上所叙述的情况, 需要详细地对照CRF、 受试者化验单、 电子数据库 等, 将会耗费大量的时间, 甚至需要妇产科专业知识 来鉴别数据的可靠性。

同样重要的核查内容还包括: 依从性核查 [8] 。 依 从性核查主要在于干预手段核查, 体现疗效需求。 本项目中涉及到药物和针刺的干预剂量、 强度、 频率 等。 本项目治疗周期长达4个月, 每个受试者第1个月 服药剂量为每日1片, 如果此月不排卵, 则下个月每 日服药增加1片, 最大剂量为每日3片, 因此, 服药的 复杂性导致出现错误的几率上升。 受试者每周接受 2次, 共32次针刺治疗, 但是很难保证受试者在4个月 内一直有时间来院治疗, 因此, 针刺干预遗漏的可能 也较大。 体现不孕症特异性的核查内容包括患者是 否按照方案要求同房。 本项目要求受试者每周2-3次 同房, 但是影响同房的因素较多, 如夫妻双方工作变 动、 生活变动等, 很难保证受试者在长达4个月的试 验中每周都依从。 同时还要核查是否服用影响主要 结局指标的合并用药等。 在受试者受孕、 妊娠后, 就 会进入随访阶段, 不再接受研究者和研究助手的直 接指导。 由于重视生育等心理, 受试者可能会自行服 用保胎药物等, 因此, 在核查时也要注意此类状况的 发生。

不孕症临床试验数据核查方法

1. 核查方法分类 数据核查大致分3种方式, 分 别为人工核查、 自动核查与医学核查 [9] 。 人工核查的 内容主要为溯源核查, 自动核查指的是借助电子软件 或者其他工具进行大范围核查, 一般适用于数量较 庞大的数据与极端值或者缺失值的筛选; 所谓医学 核查指对具有专业逻辑关系的数据核查。 在数据核 查前需要制定详细的核查计划, 也需要进行专门的 人员培训, 使核查人员熟练掌握研究方案, 数据之间 的逻辑关系, 另外对于一些专业性较强的问题, 如生 化指标和临床指标的核查需要与项目相关专业人员 沟通。 核查出的问题统一形成疑问表, 针对出现的问 题进行溯源核查和改正 [10] 。

2. 核查性质分类 一般性核查内容包括数据的 完整性、 精确性、 标准化、 及时性以及缺失值和极端 值的判定与去留等。 而专业性核查则体现的是医学 逻辑上的因果联系和时间次序关系的特异性, 是更 深层次的核查。 下面以本项目为例介绍一般性内容 与特异性内容核查的方法, 以供参考。

2.1 一般性内容核查

2.1.1 CRF精确性完整性核查: 首先检查CRF表、 知情同意书的数量是否与入组患者数量相符。 将CRF 表中的数据与已经在试验过程中输入到数据库中的 数据再次一一进行比对, 或者数据库有二次录入功v 能, 在进行二次数据录入后, 与原始数据进行制定核 对。 在此过程中要将数据格式标准化, 对于缺失值或 者异常值予以确认输入, 做好数据核查的第步。

2.1.2 药物核查: 本项目的干预方案是药物联合 针刺的促排卵助孕方案, 依据试验报告统一标准要 求, 患者服药依从性界定关系到药效评价结果。 药物 核查内容包括用法、 用量及剩余药品。 主要从两个途 径进行: 第一, 根据CRF表中服药记录, 核查患者服 药情况是否与研究方案要求相符合。 第二, 根据分中 心返回的剩余药物核对服药量是否与记录相符合。 此项目中患者的服药依从性错误主要包括两大类: 第 一类是服药情况没有依从研究方案要求, 出现多服 药或者少服药的情况, 项目组将超出或者少于应服药 量25%的情况定义为方案违反; 第二类是服药记录 错误的情况, 也就是剩余药量与服药记录对应不上, 出现这种情况就需要与当时发药的研究助手以及患 者本人进行核对溯源, 以明确真实情况。

2.1.3 针刺核查: 本项目的针刺是另外一种干预 措施, 依据针刺临床试验干预措施报告标准要求, 主要核查内容包括针刺间隔、 针刺次数、 针刺记录 是否规范等。 值得注意的是: 本项目的研究方案要 求每次针刺前需要做尿妊娠试验, 如结果是阳性 则应该停止针刺。 项目也要求患者每周采血一次化 验孕酮值及人绒毛膜促性腺激素(human chorionic gonadotropin, HCG)值, 由于血清HCG检测的敏感度 优于尿HCG的检测, 有时会发生如下情况, 患者在针 刺当天的尿妊娠试验是阴性, 而当天采血后出来的 血HCG值却是阳性, 但是当天患者也接受了针刺治 疗 , 这样的情况就不能算作是方案偏离情况。 2.1.4 实验室指标: 生化指标核查应该主要关注 缺失值和异常值, 核查缺失值是因样本缺失引起还 是漏录引起; 核查异常值是因录入错误引起还是检 测结果异常引起, 如果不是录入错误则应该复测该 样本以确定数据。

2.2 特异性内容核查

2.2.1 妊娠结局: 妊娠结局是本项目的终点结局 指标, 是数据核查的重点, 妇女的生殖孕产包括一 系列事件, 过程复杂, 但时间次序和因果逻辑关系清 晰, 所以也是核查的难点, 是不孕症临床试验特异性 数据。 首先要明确妊娠结局的各个概念 [11] : ①受孕是 指血清的β-HCG值呈阳性; ②妊娠是指可在B超下 见到子宫内胎心搏动的生理状态; ③活产是指怀孕 满20周的胎儿出生时有生命体征; ④早期流产: 怀孕 12周以内终止, 包括生化流产(HCG升高后又下降, 没有看到宫内胎囊) 、 有胎心搏动的早期流产(宫内 胎囊) 、 无胎心搏动的早期流产(宫内胎囊) ; ⑤晚 期流产: 怀孕12周以上的流产。

受孕、 妊娠、 流产、 活产等各种状态之间存在逻辑 关系, 如, 只有排卵、 受孕后才能到妊娠的状态; 每个 患者在试验过程中各种孕产状态只能出现1次; 活产是 针对产妇的状态, 而不代表新生儿数量, 也就是说每 个孕妇可以活产1次, 但是可以生产2个新生儿等。 核查过程中妊娠结局的逻辑关系主要应注意以 下两个方面: ①分类变量的逻辑关系核查。 这里举 例说明: 如, 该项目入组患者一共是1 000例, 对于受 孕这个变量来讲, 受孕人数(选择 “是” )加上非受孕 (选择 “否” ) 人数一定等于1 000; 患者受孕后一共 会出现3种妊娠结局, 包括流产、 异位妊娠、 活产, 那 么, 这3个变量选择 “是” 的人数相加一定等于受孕人 数; 发生早期流产与晚期流产的人数和一定等于妊 娠丢失的总人数等。 ②前后一致。 有一些变量在CRF 表中的不同模块可能会重复出现, 应该注意同一个 患者的前后选择应该一致, 当然在CRF的设计阶段 应该尽量避免重复变量的出现, 以避免此类逻辑错 误的发生。

2.2.2 不良事件: 不同于其他临床试验, 不孕 症的临床试验不良事件有其阶段性和人群的特异 性 [12-13] 。 由于妇女孕产各个阶段生理的特异性, 其 不良事件也有各个阶段的特异性。 核查时需要根据 各阶段特异性核查不良事件收集情况是否完整或 者是否得当。 ①干预期间的不良事件除了与干预措 施相关的不良事件, 如克罗米芬可引起阴道不规则 流血、 卵巢过度刺激综合征等, 针刺可引起局部皮 肤瘀青; 还应该包括一般性不良事件, 如, 感冒、 咳 嗽、 滑倒等。 ②与促排卵治疗和病种PCOS相关的孕 产期间不良事件按照生理阶段可分为妊娠早期、 妊 娠中晚期以及产后的不良事件, 包括异位妊娠、 多胎 妊娠等。 每个阶段的不良事件可特异性地反映治疗 措施在此阶段的风险性。 ③另外不孕症临床试验的 主体参与者虽然是患者本身, 但是潜在受试者包括 配偶与子代, 也直接或者间接地参与了试验, 他们 发生的不良事件也是评估治疗风险的关键因素, 如 子代的流产率以及致畸率可反映干预措施的生殖毒 性等。 ④不良事件的名称需要规范化和标准化。 不 良事件的名称可能会因为不同研究助手的记录习惯 或者不规范性而产生较大差异。 如, 患者发生了上呼 吸道感染, 可能会被记录成 “上感” “咽喉痛” “扁桃 体炎” 等, 对数据的统计造成很大障碍, 甚至有可能 造成不良事件的组间差异消失, 而影响项目安全性 的评估。 在核查时需要将类似情况按照国际通用的 不良事件规范用语, 如世界卫生组织不良反应术语集 (WHOART) 和人用药品注册技术规范国际协调会开 发的国际医学用语词典 (MedDRA) 进行归类整理。

小结

临床试验结果或者结论的科学性, 来源于统计 学家对试验中所收集数据的人群划分和精确统计。 高循证医学级别的临床试验结果往往会指导或者改 变人们的临床实践指南和临床路径, 所以, 结果的科 学性和准确性至关重要。 临床数据是医学语言, 来源 于临床实践, 大型临床试验中数据成千上万, 但不能 直接被统计程序应用, 需要经过核查, “去伪存真” 使其转化成标准化、 数据化的统计学语言, 才能完 成统计过程, 得出科学结论。 因此, 临床试验数据核 查策略可以进一步加强高循证医学级别临床试验的 数据科学性与准确性, 为临床实践提供更可靠的医 学证据。

来源:中华中医药杂志 作者:高敬书 王宇 蔡汪宇 吴效科


相关文章