什么是中心效应
1.1效应
一个因素不同水平所对应的总体疗效差异可以称为该因素的效应。如干预效应,当干预措施为分组使用不同医疗器械时,试验器械和对照器械所对应的总体疗效差异称为干预效应。常用的效应指标如率差、率比、均值差值等。
1.2中心效应的定义
中心效应即由于各中心的试验条件不完全相同,不同中心在受试者基线特征、临床实践等方面可能存在差异,导致不同中心间对应的总体疗效差异[1]。中心效应只存在于多中心临床试验中,而单中心临床试验是无需考虑的。
1.3评价中心效应的必要性
多中心临床试验各中心间结论应当一致。但是当各中心的结论差异较大时,无法真实反映医疗器械的有效性。因此在疗效评价时,需考虑疗效在中心间的差异。
2
出现中心效应的可能原因
2.1客观因素
虽然试验方案规定了统一的纳入和排除标准,要求实验室的检测方法等诸多条件尽可能一致,但同一医疗器械在不同中心间的试验结果难以表现出完全一致[2]。还可能受到诸多因素的影响,如受试者的人种差异、年龄差异、病情差异和各中心的医疗水平、业务素质、技术条件及地域差异等。因此中心效应总是客观存在的[3]。
2.2主观因素
一般情况下,大多数医疗器械需要研究者直接操作,其有效性与研究者的使用熟练程度有直接关系,熟练使用产品可以产生更好的疗效。如果方案中的评价指标定义不清晰,各中心研究者对其理解可能存在偏差,如量表评分等较为主观的指标。此外,若未对各中心例数进行合理控制,个别中心可能会因为入组速度较慢,最终样本例数过少,由此也会导致结果的不稳定,疗效与其他中心明显不同,很有可能导致中心效应。
3
如何评价中心效应
3.1交互作用
在评价中心效应时,有时会出现交互作用,我们先来了解一下交互作用的概念。在一个试验中有两个或两个以上的处理因素,如果A因素对因变量的效应在B因素的每一个水平上有差异(或者反过来),那么就说A和B之间有交互作用。如下图1和图2所示,A因素为组别,B因素为中心,试验组和对照组的疗效之差在各中心间相等,即组别和中心无交互作用。如下图3和图4所示,试验组和对照组的疗效之差在各中心间存在差异,即组别和中心有交互作用。
3.2中心效应的常见分类情况
为了方便大家更直观地理解中心效应,我们通过下面四个图来说明。假设有多中心临床试验,其主要评价指标为有效率,包括四个研究中心,干预因素为分组(试验组和对照组),干预效应则为试验组与对照组的疗效差异,即试验组与对照组间有效率的差值。评价是否存在中心效应,可能得到的结果主要分为四种情况,简单概括分别是:无中心效应、有中心效应但无交互作用、有中心效应与定量交互作用、有中心效应与定性交互作用。
3.3无中心效应
如下图1所示,各中心试验组(或对照组)的疗效相近,试验组与对照组的疗效之差也相近,是比较理想的情况。
3.4有中心效应但无交互作用
如下图2所示,虽然各中心试验组(或对照组)的疗效差异显著,但试验组与对照组疗效之差相近,称干预效应在各中心间是同质(或齐性的)。
3.5有中心效应与定量交互作用
如下图3所示,虽然各中心试验组(或对照组)的疗效差异显著,且至少存在两个中心间试验组与对照组疗效之差的差异显著,但各中心试验组疗效均高于对照组。
3.6有中心效应与定性交互作用
如下图4所示,各中心试验组(或对照组)的疗效差异显著,至少存在两个中心间试验组与对照组疗效之差的差异显著,且各中心试验组疗效不一定高于对照组疗效。
4
中心效应的处理方法
4.1临床试验过程中的控制
在临床试验过程中,为尽量避免中心效应的产生,提高数据质量,需注意以下几个方面:一是制定多方均认可的试验方案,并以此指导整个试验,保证各研究中心实际操作过程中严格遵循方案。二是试验开始前对工作人员严格培训,要求各研究中心的研究者操作规范,评定量表(或治疗效果)时统一标准。三是各项指标采集时,如实验室检查,中心间需保持单位一致,此外,对于像影像学结果等较为主观的判定,可设中心实验室,安排相关人员统一读取结果。四是筛选合适的研究中心,中心间样本分布应避免严重不均衡。五是对各中心的测量仪器等进行质量控制,调动研究者的工作责任和工作热情[4]等。
4.2统计分析时可采用的方法
若统计分析结果表明存在中心效应但无定性的交互作用时,可选择合适的统计分析方法以扣除中心效应,保证结果的稳健性。但需注意的是,若中心与干预间存在交互作用,则是比较复杂的问题,解释时需非常谨慎,应努力从试验的管理、受试者的基线特征、临床实践等方面寻找原因。当存在定性的交互作用时,如找不到合理的解释,则需进一步的临床试验,直到干预效应的估计可靠为止[1]。
考虑中心效应进行统计分析时,应首先评价是否存在交互作用,若无交互作用,再进一步评价是否存在中心效应,如有中心效应,进一步扣除中心效应后,进行组间比较。根据效应指标的分类,对应选择合适的统计分析方法。
若评价指标为分类变量(以二分类变量为例),常见的统计分析方法有Breslow-Day法、CMH法和Logistic回归等,其中Breslow-Day法用于检验是否存在中心效应[5],CMH法用于评价扣除中心效应后组间是否存在差异,两种方法相互配合。Logistic回归模型可方便快速地完成中心效应的检验及扣除中心效应后组间疗效的比较,而且该模型可以考虑协变量等重要影响因素,是目前应用较为广泛且简便的方法之一,其主要思想是分别建立三个Logistic回归模型,有不包含中心效应的模型A、包含中心效应的模型B、包含中心效应及交互作用的模型C,然后通过对比模型A与模型B来检验中心效应,通过对比模型B与模型C来检验交互作用。
若评价指标为连续型变量,则常用一般线性模型来评价中心效应,其主要思想同样是建立仅包括分组变量、包括分组和中心变量、包括分组和中心及其乘积项的三个模型,通过模型检验结果评价是否存在中心效应、及是否需进一步校正分析结果。
若评价指标为生存资料,当只考虑中心效应而没有其他协变量时,可采用Mantel-Haenszel法、分层log-rank检验等。当需同时考虑中心效应、交互作用、基线等协变量时,则需采用Cox比例风险模型[1]。
当中心数较多时(例如大于10),可能各中心的样本量较低,Breslow-Day、Logistic回归结果不稳健。此外,由于回归模型会将中心变量哑变量化,模型会消耗较多自由度,也不利于组间效应的假设检验。统计专家建议,可以考虑随机效应模型用以处理中心数非常多各中心例数也不少时的中心效应[1]。
需要各位注意的是,虽然在统计分析阶段可以对中心效应进行校正处理,但是统计不是万能的,真正的最佳处理办法是合理地设计方案、严格地执行方案、有效地控制各中心存在的差异因素。
以上就是本文的全部内容了,如有错误之处,敬请批评指正,谢谢。
参考文献:
[1]陈峰,夏结来.临床试验统计学[M].2018:187-201.
[2]毕京峰,丁晋彪.基于中心效应和临床界值的多中心临床试验评价方法学探讨[J].中国卫生统计,2011,28(3):330-331.
[3]吴健兰.不同统计学方法在中药多中心临床试验“中心效应”问题研究中的应用[D].北京中医药大学, 2011.
[4]高晨燕,丁德云.多中心临床试验(一):组织与方案[J].中国卫生统计,1998(6):56-59.
[5]于浩,陈峰.临床试验中中心效应的评价及处理方法[J].中国临床药理学与治疗学,2004,9(9):1073-1076.
作者:广州奥咨达医疗器械技术股份有限公司 临床研究第一事业部 生物统计部
准备好开始了吗?
那就与我们取得联系吧