不孕症临床试验数据的核查_中医百科

不孕症大型临床试验的数据核查策略

所有临床试验都涉及到数据的收集、核查与统计的阶段，这其中包含着大量数据的记录、核查、分析的工作 [1] 。想得到真实的研究结论，这其中的每一步都至关重要。不孕症临床试验因其受试者人群孕产特异性，在数据核查阶段也有其区别与其他临床试验的特点。

我院妇科是国家临床研究基地妇科重点病种的的具体承担单位科室，重点研究病种是 “多囊卵巢综合征（polycystic ovary syndrome， PCOS） ” 。笔者亲自参与了我院妇科主持并已经完成的2项多中心、大样本项目的课题核查过程 [2-3] 。其中， “针刺和克罗米芬对多囊卵巢综合征无排卵妇女活产率的影响（PCOSAct） ” 是一项国际合作的大型随机对照临床试验，目的是探讨针刺联合克罗米芬对PCOS妇女的孕产是否有更好的临床疗效，其终点结局指标是 “活产率” ，在全国25家医院共纳入了1 000例受试者，历时近4年完成试验的干预与产科重点结局数据的收集与核查统计，本文以该项目数据核查为例，将不孕症相关临床试验的核查经验与策略呈现如下。

明确核查内容

在核查过程开始，首先要确定需要核查的内容，也就是从临床试验过程中采集的数据，这些数据被记录在纸质病例报告表（case report form， CRF）与电子数据库中。为了保证科研效率，临床试验中数据采集不是漫无目的的，所有数据的采集设计都要有一定科学研究依据，这些指标的设计都直接关系或者间接体现到PCOS发生和发展、 PCOS的异质性、干预措施的有效性及安全性。

通常CRF首先要获取人口学特征，不同人口学特征的人群对于干预措施的反应也不相同，进而影响疗效评价，是很重要的数据 [4] ；体格参数、既往史和现病史，可以帮助研究者纳入及排除患者，同时也提供部分基线数据，也可用以评估疗效；最重要的是疗效评价指标和安全性指标，以帮助研究者评估临床试验中干预措施的有效性和安全性，是临床试验的核心问题；此外还有时间指标，帮助判定患者对于治疗方案的时间依赖性关系；还有依从性指标，可以通过方案偏离违反事件的发生率反映临床试验完成质量并为优化研究方案提供证据 [5] 。

不孕症临床试验数据的核查重点与难点数据核查实质上是检查临床研究中所采集数据的真实性、完整性、准确性以及时效性 [6] ： ①真实性：数据反映受试者的真实而不是虚假情况； ②完整性： CRF表条目收集完整、病例数收集完整； ③准确性：采集数据时保证数据的精准性以避免偏差，能够正确理解研究方案并熟练地掌握信息采集方法 [7] ； ④时效性：数据必须符合方案中规定的时间限制，避免拖延。

1. 核查重点：纳入、排除标准所有临床试验中，纳、排标准的核查都是重中之重。纳入、排除标准体现了诊断疾病严格性和受试人群的均一性特点。在随机对照临床试验中强调的是纳入同质人群，有严格的筛选标准，确保治疗的是目标疾病。如本项目要纳入的患者是月经稀发的PCOS患者，筛选标准是十分明确的修改版鹿特丹国际通行标准（月经稀发或闭经，同时合并多囊样卵巢或/和高雄激素血症或/和临床高雄），如果纳入了其他病种患者或者同一病种其他诊断标准的患者，则干预效果的真实性就会受到破坏，严重干扰结论的正确性，直接影响日后研究结论的外推范围，属于严重的方案违反情况，在做符合方案分析集统计时，需要剔除此病例。

2. 核查难点：临床终点指标与方案依从性在不孕症临床试验中不仅要注意普遍性核查内容，更应该注意与不孕症治疗相关的特异性核查内容。妊娠结局体现终点指标，包括女性生殖发育全过程的各节点，包括排卵、受孕、妊娠、流产和活产等，这些指标之间的逻辑关系和时间次序，是不孕症临床试验核查的难点。如，对于活产的受试者，之前一定有排卵、受孕、妊娠；对于生化流产的受试者，之前一定有排卵、受孕，之后没有妊娠和活产；流产的患者之前一定有排卵、受孕、妊娠，之后没有活产。一旦有些受试者的数据出现了不符合以上所叙述的情况，需要详细地对照CRF、受试者化验单、电子数据库等，将会耗费大量的时间，甚至需要妇产科专业知识来鉴别数据的可靠性。

同样重要的核查内容还包括：依从性核查 [8] 。依从性核查主要在于干预手段核查，体现疗效需求。本项目中涉及到药物和针刺的干预剂量、强度、频率等。本项目治疗周期长达4个月，每个受试者第1个月服药剂量为每日1片，如果此月不排卵，则下个月每日服药增加1片，最大剂量为每日3片，因此，服药的复杂性导致出现错误的几率上升。受试者每周接受 2次，共32次针刺治疗，但是很难保证受试者在4个月内一直有时间来院治疗，因此，针刺干预遗漏的可能也较大。体现不孕症特异性的核查内容包括患者是否按照方案要求同房。本项目要求受试者每周2-3次同房，但是影响同房的因素较多，如夫妻双方工作变动、生活变动等，很难保证受试者在长达4个月的试验中每周都依从。同时还要核查是否服用影响主要结局指标的合并用药等。在受试者受孕、妊娠后，就会进入随访阶段，不再接受研究者和研究助手的直接指导。由于重视生育等心理，受试者可能会自行服用保胎药物等，因此，在核查时也要注意此类状况的发生。

不孕症临床试验数据核查方法

1. 核查方法分类数据核查大致分3种方式，分别为人工核查、自动核查与医学核查 [9] 。人工核查的内容主要为溯源核查，自动核查指的是借助电子软件或者其他工具进行大范围核查，一般适用于数量较庞大的数据与极端值或者缺失值的筛选；所谓医学核查指对具有专业逻辑关系的数据核查。在数据核查前需要制定详细的核查计划，也需要进行专门的人员培训，使核查人员熟练掌握研究方案，数据之间的逻辑关系，另外对于一些专业性较强的问题，如生化指标和临床指标的核查需要与项目相关专业人员沟通。核查出的问题统一形成疑问表，针对出现的问题进行溯源核查和改正 [10] 。

2. 核查性质分类一般性核查内容包括数据的完整性、精确性、标准化、及时性以及缺失值和极端值的判定与去留等。而专业性核查则体现的是医学逻辑上的因果联系和时间次序关系的特异性，是更深层次的核查。下面以本项目为例介绍一般性内容与特异性内容核查的方法，以供参考。

2.1 一般性内容核查

2.1.1 CRF精确性完整性核查：首先检查CRF表、知情同意书的数量是否与入组患者数量相符。将CRF 表中的数据与已经在试验过程中输入到数据库中的数据再次一一进行比对，或者数据库有二次录入功v 能，在进行二次数据录入后，与原始数据进行制定核对。在此过程中要将数据格式标准化，对于缺失值或者异常值予以确认输入，做好数据核查的第步。

2.1.2 药物核查：本项目的干预方案是药物联合针刺的促排卵助孕方案，依据试验报告统一标准要求，患者服药依从性界定关系到药效评价结果。药物核查内容包括用法、用量及剩余药品。主要从两个途径进行：第一，根据CRF表中服药记录，核查患者服药情况是否与研究方案要求相符合。第二，根据分中心返回的剩余药物核对服药量是否与记录相符合。此项目中患者的服药依从性错误主要包括两大类：第一类是服药情况没有依从研究方案要求，出现多服药或者少服药的情况，项目组将超出或者少于应服药量25%的情况定义为方案违反；第二类是服药记录错误的情况，也就是剩余药量与服药记录对应不上，出现这种情况就需要与当时发药的研究助手以及患者本人进行核对溯源，以明确真实情况。

2.1.3 针刺核查：本项目的针刺是另外一种干预措施，依据针刺临床试验干预措施报告标准要求，主要核查内容包括针刺间隔、针刺次数、针刺记录是否规范等。值得注意的是：本项目的研究方案要求每次针刺前需要做尿妊娠试验，如结果是阳性则应该停止针刺。项目也要求患者每周采血一次化验孕酮值及人绒毛膜促性腺激素（human chorionic gonadotropin， HCG）值，由于血清HCG检测的敏感度优于尿HCG的检测，有时会发生如下情况，患者在针刺当天的尿妊娠试验是阴性，而当天采血后出来的血HCG值却是阳性，但是当天患者也接受了针刺治疗，这样的情况就不能算作是方案偏离情况。 2.1.4 实验室指标：生化指标核查应该主要关注缺失值和异常值，核查缺失值是因样本缺失引起还是漏录引起；核查异常值是因录入错误引起还是检测结果异常引起，如果不是录入错误则应该复测该样本以确定数据。

2.2 特异性内容核查

2.2.1 妊娠结局：妊娠结局是本项目的终点结局指标，是数据核查的重点，妇女的生殖孕产包括一系列事件，过程复杂，但时间次序和因果逻辑关系清晰，所以也是核查的难点，是不孕症临床试验特异性数据。首先要明确妊娠结局的各个概念 [11] ： ①受孕是指血清的β-HCG值呈阳性； ②妊娠是指可在B超下见到子宫内胎心搏动的生理状态； ③活产是指怀孕满20周的胎儿出生时有生命体征； ④早期流产：怀孕 12周以内终止，包括生化流产（HCG升高后又下降，没有看到宫内胎囊）、有胎心搏动的早期流产（宫内胎囊）、无胎心搏动的早期流产（宫内胎囊）； ⑤晚期流产：怀孕12周以上的流产。

受孕、妊娠、流产、活产等各种状态之间存在逻辑关系，如，只有排卵、受孕后才能到妊娠的状态；每个患者在试验过程中各种孕产状态只能出现1次；活产是针对产妇的状态，而不代表新生儿数量，也就是说每个孕妇可以活产1次，但是可以生产2个新生儿等。核查过程中妊娠结局的逻辑关系主要应注意以下两个方面： ①分类变量的逻辑关系核查。这里举例说明：如，该项目入组患者一共是1 000例，对于受孕这个变量来讲，受孕人数（选择 “是” ）加上非受孕（选择 “否” ）人数一定等于1 000；患者受孕后一共会出现3种妊娠结局，包括流产、异位妊娠、活产，那么，这3个变量选择 “是” 的人数相加一定等于受孕人数；发生早期流产与晚期流产的人数和一定等于妊娠丢失的总人数等。 ②前后一致。有一些变量在CRF 表中的不同模块可能会重复出现，应该注意同一个患者的前后选择应该一致，当然在CRF的设计阶段应该尽量避免重复变量的出现，以避免此类逻辑错误的发生。

2.2.2 不良事件：不同于其他临床试验，不孕症的临床试验不良事件有其阶段性和人群的特异性 [12-13] 。由于妇女孕产各个阶段生理的特异性，其不良事件也有各个阶段的特异性。核查时需要根据各阶段特异性核查不良事件收集情况是否完整或者是否得当。 ①干预期间的不良事件除了与干预措施相关的不良事件，如克罗米芬可引起阴道不规则流血、卵巢过度刺激综合征等，针刺可引起局部皮肤瘀青；还应该包括一般性不良事件，如，感冒、咳嗽、滑倒等。 ②与促排卵治疗和病种PCOS相关的孕产期间不良事件按照生理阶段可分为妊娠早期、妊娠中晚期以及产后的不良事件，包括异位妊娠、多胎妊娠等。每个阶段的不良事件可特异性地反映治疗措施在此阶段的风险性。 ③另外不孕症临床试验的主体参与者虽然是患者本身，但是潜在受试者包括配偶与子代，也直接或者间接地参与了试验，他们发生的不良事件也是评估治疗风险的关键因素，如子代的流产率以及致畸率可反映干预措施的生殖毒性等。 ④不良事件的名称需要规范化和标准化。不良事件的名称可能会因为不同研究助手的记录习惯或者不规范性而产生较大差异。如，患者发生了上呼吸道感染，可能会被记录成 “上感” “咽喉痛” “扁桃体炎” 等，对数据的统计造成很大障碍，甚至有可能造成不良事件的组间差异消失，而影响项目安全性的评估。在核查时需要将类似情况按照国际通用的不良事件规范用语，如世界卫生组织不良反应术语集（WHOART）和人用药品注册技术规范国际协调会开发的国际医学用语词典（MedDRA）进行归类整理。

小结

临床试验结果或者结论的科学性，来源于统计学家对试验中所收集数据的人群划分和精确统计。高循证医学级别的临床试验结果往往会指导或者改变人们的临床实践指南和临床路径，所以，结果的科学性和准确性至关重要。临床数据是医学语言，来源于临床实践，大型临床试验中数据成千上万，但不能直接被统计程序应用，需要经过核查， “去伪存真” 使其转化成标准化、数据化的统计学语言，才能完成统计过程，得出科学结论。因此，临床试验数据核查策略可以进一步加强高循证医学级别临床试验的数据科学性与准确性，为临床实践提供更可靠的医学证据。

来源：中华中医药杂志作者：高敬书王宇蔡汪宇吴效科

相关文章