随机对照试验(randomized controlled trials,RCT)通常被认为是循证医学干预性研究证据的金标准之一[1]。而基于 RCT 的系统评价和 Meta 分析通过收集汇总具有相同研究目的和手段且相互独立的多个临床试验,可以从中获得较可靠的结论[2, 3],往往作为循证医学中的最高等级证据[4]。单个 RCT 全程规范化实施对保证临床试验质量至关重要,有关随机化在临床试验中的应用情况近年受到关注[5, 6],已有若干学者选择不同期刊发表的临床试验文献进行了回顾性调查[7-13]。然而,这些调查并未区分试验的盲态情况,难以反映非盲态临床试验的随机化状况,而非盲态试验的随机化方法选择和实施恰恰是直接影响临床试验质量的最重要环节。为此,本研究回顾分析权威医学期刊《新英格兰医学杂志》(The New England Journal of Medicine,NEJM)2018 年发表的 RCT,了解新近临床试验特别是非盲态临床试验随机化方法的应用现状,以期为临床试验随机化方法选择和实施以及质量改进提供参考依据。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
RCT。
1.1.2 文献来源
NEJM 网站(https://www.nejm.org/)。
1.1.3 发表时间
2018 年。
1.1.4 排除标准
未提供有关试验设计信息和研究结果的论文。
1.2 文献检索策略
在“All the words”检索项录入“random”,在“Search within”检索项选择“Full text”,在“Article category”检索项选择“Research”,在“Date”检索项选择“Jan 2018”至“Dec 2018”。
1.3 文献筛选与资料提取
由 2 名研究者独立筛选文献和提取资料。文献筛选时首先阅读摘要,对可能纳入的文献下载全文电子版进行精读,如有分歧,则通过讨论或与第三方协商解决。采用 EpiData 3.2 软件建立数据库,由 2 名研究者独立录入数据,并进行一致性比对,提取资料主要包括文献的基本信息、试验设计的要素信息、随机化的相关内容等。为了不致引起信息提取和统计分析时的概念混淆,我们对一些可能出现交叉的项目进行了界定。在试验设计涉及到的项目中,盲态试验定义为在整个试验过程中完整保持盲态的试验(通常称为双盲试验),将单盲试验、进行结局指标盲态评估的开放性试验等均归为非盲态试验;阳性对照试验仅指两组试验中一组为阳性对照的情形,安慰剂对照试验指两组或多组中有一组设为安慰剂的试验,剂量对照试验专指按剂量大小分组的试验(如剂量对照试验中包含了剂量为 0 的对照组,该试验不归为安慰剂对照试验),空白对照试验指非盲态、其中一组设为空白不予施加额外处理的试验。在进行随机化方法分类时,将单纯采用简单随机化、区组随机化、偏币随机化、瓮法随机化均归为传统随机化方法;而采取中心分层或者相关基线变量进行适应性随机化的均归入协变量适应性随机化方法;其他的随机化方法另行说明。
1.4 统计分析
采用 SAS 9.4 系统进行统计分析。针对定性分类指标,采用例数、百分比进行描述,组间比较采用 Fisher 精确概率检验方法,当 P<0.05 时认为差异有统计学意义。
2 结果
2.1 文献筛选流程及结果
初检共获得文献 171 篇,经逐层筛选后,纳入 151 个 RCT 进行分析。
2.2 纳入研究的基本特征
纳入研究的基本特征见表 1。非盲态试验以多中心(90.79%)、两组干预(82.89%)、等比例(84.21%)样本分配为主要类型。非盲态试验与盲态试验在试验总样本量、中心数、试验组数方面的差异无统计学意义(P>0.05),而在样本量分配比例、干预措施及对照组类型方面的差异有统计学意义(P<0.05)。

2.3 试验随机化方法应用情况
纳入 RCT 中,未报告具体随机化方法的 34 篇(22.52%)、报告随机化方法的 117 篇(77.48%)。在报告具体随机化方法的 RCT 中,以分层区组随机化(72.65%)最多,其次为区组随机化(11.11%)、最小化(9.40%)、简单随机化(4.27%)等。盲态试验和非盲态试验之间报告随机化方法的比例及其采用不同随机化方法的比例均无明显差别(P>0.05)(表 2)。

2.4 非盲态试验随机分配隐藏报告
在 76 篇非盲态 RCT 中,明确报告随机分配隐藏方法的仅 38 篇(50.00%),其中 37 篇采用中央随机法(97.37%),1 篇采用信封法(2.63%)。
3 讨论
已有研究者[7-13]对已经发表临床试验随机化应用情况进行了回顾性调查。2013 年,Clark 等[7]对 42 本核心临床期刊 2011 年 1 月发表的 85 篇 RCT 进行了分析,结果显示报告了随机序列生成方法的占 68%,报告分配隐藏方法的占 32%,报告受试者招募人和随机序列生成者的占 31%。2015 年,Higham 等[8]回顾 4 本国际医学期刊 2012 年 6~9 月发表的 82 篇 RCT,发现 88% 的随机化方法为限制性随机化方法,且其中 90% 采用了区组随机化。2015 年,Lin 等[9]调查了 2014 年 1~12 月发表在 3 本国际医学期刊上的 RCT,结果显示 6% 采用简单随机化,12% 采用常规区组随机化,70% 采用分层区组随机化,11% 采用最小化方法,1% 采用动态层级随机化。2019 年,陈君超等[10]检索了 2016 年发表在 4 本医学期刊上的 237 篇 RCT,结果显示分层区组随机化占比达到 61%,区组随机化为 18%,简单随机化为 14%,动态随机化为 7%。
本研究结果也发现,NEJM 发表的 RCT 采用分层区组随机化最多,其次为区组随机化、最小化随机和简单随机化。由于非盲态试验与盲态试验相比,非盲态试验如果随机化方法选择不当,导致更大的选择偏倚风险,因此本文还根据盲法实施的不同进行了对比分析,结果发现盲态试验和非盲态试验数量相近,且在 76 篇非盲态 RCT 中,有 21 篇(27.63%)未报告具体随机化方法。
从本研究和上述一些权威期刊发表的临床试验所使用的随机化方法看,依然以区组随机化方法为主流,但早在 2006 年,对于区组随机化方法的应用就遭到批判[14, 15],特别是在非盲态试验中,该类方法的确定性分配概率和猜对分配概率较高,不能很好避免选择偏倚,应被更好的方法替代[16]。例如,大棒设计(big stick design,BSD)法在两组随机化方法比较中,显示出较好的性能,是两处理组、等比例分配临床试验随机化方法的推荐选择[17],区组瓮(block urn design,BUD)法也显示出优于传统随机化方法的优异性能[18]。
然而十余年来,对这一倡导和建议的反应并不积极,一些性能较好的新型随机化方法并未得到推广应用。究其可能的原因,一是研究者对区组随机化方法的认识根深蒂固,一些教科书、技术指导仍将其推荐为主要方法;二是学术界对随机化方法的研究尚未形成共识,对一些性能更优的新型随机化方法介绍不够;三是在实践应用中还缺少足够的行之有效的随机化实现工具等。这一现状如果不能得到扭转,临床试验质量的提高将不能得到保障。
本文的局限性:① 本文只调查了一本英文期刊一年发表的 RCT,在结果的代表性方面可能存在局限;② 有关随机化报告透明性的指标结果,例如随机序列生成方法和随机分配隐藏方法的报告比例仅基于发表的正文内容进行信息提取和统计,并没有进一步追溯附件等资料的报告细节,可能有一定程度低估。
综上所述,目前在 NEJM 发表的 RCT 仍存在随机化方法选择有待优化和随机化报告透明性不够的问题。我们呼吁尽快扭转随机方法应用仍以区组随机化为主导的局面,采取随机化质量促进行动,加强随机化方法的理论研究,规范随机化方法的正确应用和透明报告,不断提升随机化的质量和水平,确保临床试验的质量。
随机对照试验(randomized controlled trials,RCT)通常被认为是循证医学干预性研究证据的金标准之一[1]。而基于 RCT 的系统评价和 Meta 分析通过收集汇总具有相同研究目的和手段且相互独立的多个临床试验,可以从中获得较可靠的结论[2, 3],往往作为循证医学中的最高等级证据[4]。单个 RCT 全程规范化实施对保证临床试验质量至关重要,有关随机化在临床试验中的应用情况近年受到关注[5, 6],已有若干学者选择不同期刊发表的临床试验文献进行了回顾性调查[7-13]。然而,这些调查并未区分试验的盲态情况,难以反映非盲态临床试验的随机化状况,而非盲态试验的随机化方法选择和实施恰恰是直接影响临床试验质量的最重要环节。为此,本研究回顾分析权威医学期刊《新英格兰医学杂志》(The New England Journal of Medicine,NEJM)2018 年发表的 RCT,了解新近临床试验特别是非盲态临床试验随机化方法的应用现状,以期为临床试验随机化方法选择和实施以及质量改进提供参考依据。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
RCT。
1.1.2 文献来源
NEJM 网站(https://www.nejm.org/)。
1.1.3 发表时间
2018 年。
1.1.4 排除标准
未提供有关试验设计信息和研究结果的论文。
1.2 文献检索策略
在“All the words”检索项录入“random”,在“Search within”检索项选择“Full text”,在“Article category”检索项选择“Research”,在“Date”检索项选择“Jan 2018”至“Dec 2018”。
1.3 文献筛选与资料提取
由 2 名研究者独立筛选文献和提取资料。文献筛选时首先阅读摘要,对可能纳入的文献下载全文电子版进行精读,如有分歧,则通过讨论或与第三方协商解决。采用 EpiData 3.2 软件建立数据库,由 2 名研究者独立录入数据,并进行一致性比对,提取资料主要包括文献的基本信息、试验设计的要素信息、随机化的相关内容等。为了不致引起信息提取和统计分析时的概念混淆,我们对一些可能出现交叉的项目进行了界定。在试验设计涉及到的项目中,盲态试验定义为在整个试验过程中完整保持盲态的试验(通常称为双盲试验),将单盲试验、进行结局指标盲态评估的开放性试验等均归为非盲态试验;阳性对照试验仅指两组试验中一组为阳性对照的情形,安慰剂对照试验指两组或多组中有一组设为安慰剂的试验,剂量对照试验专指按剂量大小分组的试验(如剂量对照试验中包含了剂量为 0 的对照组,该试验不归为安慰剂对照试验),空白对照试验指非盲态、其中一组设为空白不予施加额外处理的试验。在进行随机化方法分类时,将单纯采用简单随机化、区组随机化、偏币随机化、瓮法随机化均归为传统随机化方法;而采取中心分层或者相关基线变量进行适应性随机化的均归入协变量适应性随机化方法;其他的随机化方法另行说明。
1.4 统计分析
采用 SAS 9.4 系统进行统计分析。针对定性分类指标,采用例数、百分比进行描述,组间比较采用 Fisher 精确概率检验方法,当 P<0.05 时认为差异有统计学意义。
2 结果
2.1 文献筛选流程及结果
初检共获得文献 171 篇,经逐层筛选后,纳入 151 个 RCT 进行分析。
2.2 纳入研究的基本特征
纳入研究的基本特征见表 1。非盲态试验以多中心(90.79%)、两组干预(82.89%)、等比例(84.21%)样本分配为主要类型。非盲态试验与盲态试验在试验总样本量、中心数、试验组数方面的差异无统计学意义(P>0.05),而在样本量分配比例、干预措施及对照组类型方面的差异有统计学意义(P<0.05)。

2.3 试验随机化方法应用情况
纳入 RCT 中,未报告具体随机化方法的 34 篇(22.52%)、报告随机化方法的 117 篇(77.48%)。在报告具体随机化方法的 RCT 中,以分层区组随机化(72.65%)最多,其次为区组随机化(11.11%)、最小化(9.40%)、简单随机化(4.27%)等。盲态试验和非盲态试验之间报告随机化方法的比例及其采用不同随机化方法的比例均无明显差别(P>0.05)(表 2)。

2.4 非盲态试验随机分配隐藏报告
在 76 篇非盲态 RCT 中,明确报告随机分配隐藏方法的仅 38 篇(50.00%),其中 37 篇采用中央随机法(97.37%),1 篇采用信封法(2.63%)。
3 讨论
已有研究者[7-13]对已经发表临床试验随机化应用情况进行了回顾性调查。2013 年,Clark 等[7]对 42 本核心临床期刊 2011 年 1 月发表的 85 篇 RCT 进行了分析,结果显示报告了随机序列生成方法的占 68%,报告分配隐藏方法的占 32%,报告受试者招募人和随机序列生成者的占 31%。2015 年,Higham 等[8]回顾 4 本国际医学期刊 2012 年 6~9 月发表的 82 篇 RCT,发现 88% 的随机化方法为限制性随机化方法,且其中 90% 采用了区组随机化。2015 年,Lin 等[9]调查了 2014 年 1~12 月发表在 3 本国际医学期刊上的 RCT,结果显示 6% 采用简单随机化,12% 采用常规区组随机化,70% 采用分层区组随机化,11% 采用最小化方法,1% 采用动态层级随机化。2019 年,陈君超等[10]检索了 2016 年发表在 4 本医学期刊上的 237 篇 RCT,结果显示分层区组随机化占比达到 61%,区组随机化为 18%,简单随机化为 14%,动态随机化为 7%。
本研究结果也发现,NEJM 发表的 RCT 采用分层区组随机化最多,其次为区组随机化、最小化随机和简单随机化。由于非盲态试验与盲态试验相比,非盲态试验如果随机化方法选择不当,导致更大的选择偏倚风险,因此本文还根据盲法实施的不同进行了对比分析,结果发现盲态试验和非盲态试验数量相近,且在 76 篇非盲态 RCT 中,有 21 篇(27.63%)未报告具体随机化方法。
从本研究和上述一些权威期刊发表的临床试验所使用的随机化方法看,依然以区组随机化方法为主流,但早在 2006 年,对于区组随机化方法的应用就遭到批判[14, 15],特别是在非盲态试验中,该类方法的确定性分配概率和猜对分配概率较高,不能很好避免选择偏倚,应被更好的方法替代[16]。例如,大棒设计(big stick design,BSD)法在两组随机化方法比较中,显示出较好的性能,是两处理组、等比例分配临床试验随机化方法的推荐选择[17],区组瓮(block urn design,BUD)法也显示出优于传统随机化方法的优异性能[18]。
然而十余年来,对这一倡导和建议的反应并不积极,一些性能较好的新型随机化方法并未得到推广应用。究其可能的原因,一是研究者对区组随机化方法的认识根深蒂固,一些教科书、技术指导仍将其推荐为主要方法;二是学术界对随机化方法的研究尚未形成共识,对一些性能更优的新型随机化方法介绍不够;三是在实践应用中还缺少足够的行之有效的随机化实现工具等。这一现状如果不能得到扭转,临床试验质量的提高将不能得到保障。
本文的局限性:① 本文只调查了一本英文期刊一年发表的 RCT,在结果的代表性方面可能存在局限;② 有关随机化报告透明性的指标结果,例如随机序列生成方法和随机分配隐藏方法的报告比例仅基于发表的正文内容进行信息提取和统计,并没有进一步追溯附件等资料的报告细节,可能有一定程度低估。
综上所述,目前在 NEJM 发表的 RCT 仍存在随机化方法选择有待优化和随机化报告透明性不够的问题。我们呼吁尽快扭转随机方法应用仍以区组随机化为主导的局面,采取随机化质量促进行动,加强随机化方法的理论研究,规范随机化方法的正确应用和透明报告,不断提升随机化的质量和水平,确保临床试验的质量。