高质量的随机对照试验(randomized controlled trials,RCTs)是循证医学的组成部分。随机对照试验是高质量系统评价的基础,是卫生保健政策和临床实践的重要决定因素。为最有效地使用已发表的研究,研究者和作者应遵循准确和透明的 RCTs 报告规范。CONSORT 声明及其扩展版是生物医学研究中使用最广泛的报告规范之一。CONTORT 声明于 2004 年被 American Journal of Orthodontics and Dentofacial Orthopedics 采用。自 2011 年以来,该期刊一直积极遵守 CONSORT 报告规范。本文旨在解释 CONSORT 各条目与这一领域研究报告的相关性及其应用,以帮助作者向本杂志和其他矫正类杂志提交 RCTs 报告时,达到 CONSORT 声明的要求。
随机对照试验(randomized controlled trials,RCTs)是循证医学的组成部分。随机对照试验报告的读者必须能够准确理解试验是如何进行的,以评估研究结果的相关性和方法学的严谨性。研究报告有两个关键原则:一是依据报告提供的信息可以重复试验,二是方法和结果应得到足够详细地描述,以便纳入系统评价[1]。
CONSORT 声明是为了帮助改善随机对照试验的报告质量,为准备报告临床试验的研究人员提供指导。CONSORT 清单由 25 个条目组成,涵盖临床试验的所有关键要素,为如何报告此类研究的设计、实施、分析和解释设定了标准[2]。CONSORT 指南的一些扩展版涵盖了更复杂的试验设计,如整群随机试验和非劣效试验;其最新信息可在 CONSORT 网站上获得(http://www.consort-statement.org/extensions)。超过 600 家生物医学期刊,包括 2004 年的《美国矫形和口腔矫正杂志》(American Journal of Orthodontics and Dentofacial Orthopedics,AJO-DO)已采用了 CONSORT 声明,同时许多期刊也采纳了关于报告摘要的 CONSORT 规范。尽管这些建议被广泛接受,但临床试验的报告质量仍有相当大的改善空间[4-8]。
AJO-DO 认识到,采纳 CONSORT 声明并不意味着能确保遵守。在 2011 年实施了一项计划,旨在改善对 CONSORT 的依从性,从而提高 AJO-DO 杂志对随机对照试验的报告质量。该计划包括视频、CONSORT 网站链接,以及为提交有关遵从 CONSORT 规范 RCTs 报告的作者的积极指导。最近,AJO-DO 对 RCTs 的报告重新规定了格式,引入了副标题,以促进完整的报告,进而能够更有效地在系统评价过程中提取相关临床数据。
自从 AJO-DO 引入这些改变以来,其发表的 RCTs 在报告质量方面已有了很大改善;这些改善反映了编辑、审稿人和作者之间的成功互动[9]。在 2011 年至 2013 年期间提交的所有已发表试验中,报告了 37 个 CONSORT 条目及其子条目中的 33 个。但 CONSORT 中涉及方法变更(3b)、试验开始后的结局指标变更(6b)、中期分析(7b)和试验终止(14b)的条目没有充分地报告。故仍有必要加强作者首次提交的试验报告质量,从而大大节省为提高对 CONSORT 报告规范依从性的编辑工作。本文旨在解释 AJO-DO 对 RCTs 试验报告提交的要求,并描述和说明 CONSORT 清单中每个条目的重要性,以及它与牙科矫正临床试验的相关性。本文的基础是报告两组平行随机对照试验的 CONSORT 2010 解释与说明文件[2]。一个遵从 CONSORT 报告规范的已发表 RCT 已上传到 AJO-DO 网站(注释随机对照试验样本文章),并将作为解释示例。
1 清单条目及其重要性的说明
以下解释以 CONSORT 声明解释与说明文件为基础,并进行了适当调整,以更好地针对 AJO-DO 的读者(表 1)[2]。

1.1 标题和摘要
CONSORT 条目 1a:文题能识别是随机临床试验。
示例:“化学聚合(I)或光聚合(C)法对矫正患者(P)固定器的 2 年内维持度(O)对比研究;单中心随机对照临床试验。”
解释:为了帮助确保研究被适当索引和容易识别,作者应该在标题中使用“随机”一词,以表明参与者被随机分配到治疗组与对照组[10]。鼓励作者(此处不属于 CONSORT 的要求)以 PICO+格式组织标题,提供关于参与者、干预措施、对照和结局的信息。+表示可能包含与盲法、中心数、时间等相关的附加信息。
CONSORT 条目 1b:结构式摘要,包括试验设计、方法、结果、结论几个部分(具体的指导建议参见“CONSORT for abstracts”)。
解释:RCT 摘要的报告有具体的指导(表 2)。文笔流畅、详细且清楚地描述试验的摘要有助于对一篇文章的初步评估,便于从数据库中检索试验以纳入系统评价中。摘要是许多临床医生阅读文章的唯一要素,因此其准确性和质量至关重要。鉴于几乎所有与摘要有关的信息都将在主要 CONSORT 规范条目项下详细讨论,本文将在结尾部分考虑摘要条目的报告。

1.2 引言
引言部分包括背景和目的。
1.2.1 背景和目的
CONSORT 条目 2a:科学背景和对试验理由的解释。
示例:“粘合失败仍然是一个严重的问题,失败率估计为 6%~25%,这取决于放置技术和观察周期。尽管光固化材料提供了更长的有效时间并改善了对湿度的控制,但尚未有调查这些理论优势重要性的随机对照试验发表。”
解释:在试验设计阶段的良好习惯首先是检索文献以识别有关感兴趣主题的可获得证据。所检索到的资料可能有限,也可能很多;如果可能,最好能够找到高质量的系统评价。近期的高质量系统评价总结了现有的临床证据,可作为已知和未知的有关感兴趣干预措施有效性和安全性证据的参考。赫尔辛基宣言认为:在没有充分了解现有文献的情况下进行人体研究是不道德的,设计一项试验来回答已经被回答过的问题也是不道德的,只有现有证据不确定当前干预措施有效性时,这项试验研究才是恰当的[11]。
在本文的 RCT 范例中,虽然未引用系统评价结果,但作者明确指出,尚未有任何已发表的 RCT 探讨光固化法对照化学固化法的优劣。
CONSORT 条目 2b:具体目的和假设。
示例:“在这项研究中,我们旨在比较在矫正治疗后使用化学聚合或光聚合作用固定的下颌舌侧固定器的维持率。”
解释:试验的目标旨在设计试验解决问题,它们通常与特定治疗或预防性干预措施的效应有关。研究假设是预先确定的,通过试验检验以达到试验目标。研究假设比研究目标更为具体,并且可以进行明确的统计评估。实际上,研究目标和研究假说常常不易分辨。
1.3 方法
1.3.1 试验设计
CONSORT 条目 3a:描述试验设计(诸如平行设计、析因设计),包括受试者分配入各组的比例。
示例:“这是分配比例为 1∶1 的平行、随机、阳性对照试验。”
解释:最常见的试验设计类型是平行设计;但是,还应注意交叉试验设计、整群随机化设计、非劣效性检验、析因设计及混合设计等类型的临床设计。牙科中常用的研究设计有左右侧对照设计[12],有的研究还包括整群设计要素。当从每个患者的多个部位和组织中收集到多个观察结果(如牙齿或牙周部位或组织的数量)时,这种设计就会被应用[13]。不同试验设计的试验实施和分析的特征不同。因此,应详细说明这些试验设计的细节。提供特定细节(设计和分配比例)是十分重要的,如本条目示例所示。
CONSORT 条目 3b:试验开始后对试验方法所作的重要改变(如合格受试者的挑选标准),并说明原因。
示例:“开始试验后,没有对方法进行更改。”
解释:研究方案和实际执行方式之间的差异是很常见的,应恰当记录在案。设计发生变化(例如,纳入与排除标准或随访时间)的可能原因很多,包括新的外部证据\无法招募足够多的患者以及财务拮据等。对于某些“适应性”试验,如果在研究开始前未确定试验的样本量和研究的周期,研究方案允许遵循预定的规则进行有限的更改。研究方案应列出在不同情况下预设的方案调整,并且应在发表的文章中对这些变更予以记录、解释和说明[14]。对试验设计的任何变更均应完整报告,以帮助读者理解其结果,无论这种变更是方案中预知的还是因不断变化的情况导致的。
在试验开始后,示例的这项 RCT 未报告这些变化。但是没有发表的试验方案允许对此进行验证,并且在摘要结尾进行报告。
1.3.2 受试者
CONSORT 条目 4a:受试者合格标准。
示例:“采用了以下选择标准:下颌前牙没有活动性龋齿、修复体或骨折;没有牙周疾病;足够的口腔卫生。”
解释:应明确概述受试者和环境的合格标准以及相关信息,因为它们会影响试验结果与其它环境的相关性(适用性)。由于合格标准在随机分配之前应用,因此它们不会影响试验的内部效度(方法学质量)[15]。将纳入标准和排除标准进行区分不是必需的;可以用相同的标准对纳入或排除的受试者进行表述[16]。
CONSORT 条目 4b:资料收集的场所和地点。
示例:“自 2009 年 4 月至 2010 年 11 月,第一作者(N.P.)在私人诊所连续招募了使用固定矫治器完成矫正治疗的患者。”
解释:清楚地描述收集数据的环境和场所对于读者判断调查结果是否与自己的环境有关很重要。还应明确说明地理位置、参与中心数量、可用设施、相关护理提供者及其专业水平的信息。例如,在拥有最先进设施、训练有素的人员的中心和由设备简陋的诊所中新手进行的研究之间,试验结果可能会有很大的不同[15]。
1.3.3 干预措施
CONSORT 条目 5:详细描述各组干预措施的细节以使他人能够重复,包括它们实际上是在何时、如何实施的。
示例:“所有患者均接受在口内制备的 0.022 英寸(软质舌侧固定器 Tru-Chrome 多股线;Rocky Mountain 矫正,丹佛市,科罗拉多州)”。在化学聚合治疗组中,将 Maximum Cure2-部分液体粘合剂(Reliance 矫正产品,伊塔斯卡市,伊利诺伊州)混合并应用于丝线和牙齿上,Excel2-部分糊剂(Reliance 矫正产品)混合,用注射器施用。在光聚合治疗组中,将光固化液体(Assure;Reliance 矫正产品)和两层糊剂(Flow-Tain;Reliance 矫正产品)放在金属丝和相邻的瓷漆上,每颗牙使用等离子灯(Ortholite;3MUnitek,蒙罗维亚,加利福尼亚)进行 9 秒光固化。
解释:应提供每种干预措施足够详细的清晰描述,以使有经验的研究人员能够重复该试验[17]。例如,在一项多中心试验中,至少应概述给药的确切方法、持续时间和治疗时机[18]。药物干预需要解释给药方式、剂量和频率,以及无论对照或安慰剂在形状、颜色、气味和味道方面与“有效药物”都没有区别。对于其他类型的干预措施,CONSORT 用于非药物试验的扩展描述了报告要求[19]。干预措施的标准化、干预措施各个组成部分的描述以及如何评估研究者依从性都十分重要。清晰描述将进一步促进将有效比较和决策纳入系统评价[17]。
1.3.4 结局指标
CONSORT 条目 6a:完整而确切地说明预先设定的主要和次要结局指标,包括它们是在何时、如何测评的。
示例:“主要结局指标是舌侧固定器首次失效。次要结局是根据残留胶粘剂判断失效种类。患者被建议在放置固定器后的 1、3、6 个月开始去看牙科矫正医生,然后在 12、18、24 个月安排随访。当预定的预约不可行时,特别是在试验快结束时,可通过电话对固定器的完整性进行评估。”
解释:试验通常有几种结局指标,一般分为主要结局指标和次要结局指标。应该明确定义和预先规定所有结局指标,并明确说明如何以及何时进行评估。每个结局指标的定义应足够清晰,以允许其他研究者在试验中使用相同的结局指标,或者明确知悉相关结局指标与系统评价中的相关结局指标的异同性。明确预先指定的结局指标,尤其是主要结局指标非常重要,因为与试验注册和方案预发表一样,它减轻了选择性报告“感兴趣的”结局指标的问题,这种可能性在有研究中包含多个结局指标或多个时间点的数据收集时更大[20]。此外,多个结局指标记录及随之而来的多重测试,会引发与多重性和误导性解释相关的系列问题[21]。
在评估支持或不支持某项干预措施有效性的证据时,有效性和副作用之间的平衡是一个重要的考虑因素。应清晰描述所记录的副作用[22]。在非药学试验中,明确结局指标评估的具体方法和开展结局指标评估的人数尤为重要。
CONSORT 条目 6b:试验开始后对结局指标是否有任何更改,并说明原因。
示例:“试验开始后结局指标没有变化。”
解释:已发表文献的回顾研究表明,计划与报告的结局指标之间存在差异[23]。最初计划为原始试验方案的主要结局指标可能被描述为次要结局指标,而在发表的文章中,可能会介绍新的主要结局指标。已有文献报道选择性报告研究结果和将“有意义”的结果报告出来的问题[20]。因此,对任何结局指标变更以及变更原因的清晰描述,将会提高临床试验的透明度。示例所述的 RCT 中,报告结局指标没有变化;然而,也未在预先发表的临床试验方案中证实这一点。
1.3.5 样本量
CONSORT 条目 7a:如何确定样本量。
示例:“样本量的计算是基于检测两个试验组之间首次失效(主要结局指标)风险的临床相关差异达到 20% 的能力(15% vs. 35%,α=0.05,检验效能为 85%)。Foek 等人发现,光固化法舌侧固定器的失效率是 35%。我们将此值用作样本量计算的参考。计算结果表明,每个小组至少需要 93 例受试者,每组将样本量增加到 110 例,以补充随访中可能的患者脱落。”
解释:RCTs 应该具有足够的检验效能来检测试验组之间在临床结局上的重要差异(如果存在差异)或确认治疗措施之间无差异。研究人员有义务根据临床重要性和合理假设进行适当的样本量计算。
作者应提供足够的样本量估算信息,使读者可以重现样本量的计算过程[24, 25]。应明确指出,样本量的计算通常基于主要结局指标。对于连续型变量指标,作者应报告对照组的预期结局,干预组与对照组的预期差异、标准差以及检验水准和检验效能。对于二分类指标,除了标准差外,也需要相同的信息。在预期会产生群组效应的设计中,应提供群组内相关系数的值[26]。对于矫正临床试验中常见的左右侧对照设计,应指明部位之间的假定相关性[12, 27]。最后,还应描述任何有关预期随访脱落的规定。理想情况下,作者应解释样本计算中使用的参数值的来源。
临床研究一般不宜通过事后分析来证明之前的样本量是否合理。但可以通过检查效应量和可信区间以及其表现出的不确定性来判断检验效能[28]。
CONSORT 条目 7b:必要时,解释中期分析和试验中止原则。
示例:“不适用。”
解释:在延长期内招募和治疗受试者。如果在试验早期就出现了不同干预措施效果的明显差异,则出于伦理原因,可能会提前终止临床研究。可以通过中期检查结果来解决这个问题,最好由独立的数据和安全监查委员会来解决。但是,在没有进行适当更正的情况下执行多次统计检查,可能会导致错误的结果和解释[21]。作者应报告他们或数据监测委员会是否对数据进行了数次“检查”;如果是,那么进行了几次,是什么原因诱发他们这么做,使用了什么统计方法(包括任何试验正式的停止规则),以及是否在试验开始前,或在数据监测委员会通过分配看到任何临时数据之前,又或在之后的某个时间进行的数据核查。
在示例研究报告中,未报告任何中期分析或终止的办法。
1.3.6 随机化
与其他前瞻性研究相比,随机化是 RCTs 的主要优势。临床试验方法学中的随机化具有特殊含义,应该加以实施,以使研究者和受试者都无法预测下一个治疗方案的分配。术语“交替分配”、“随机分配”和基于某种确定性度量的分配—如出生日期或星期几—并不被认为是完全随机或足够明确,尽管在牙科文献中经常遇到[5,29]。这种不适当的分配方案不是真正的随机化,而与偏倚的结果有关。随机化过程要求治疗分配是完全随机的,并具有在治疗方案实际被分配前隐藏治疗方案的机制。
1.3.6.1 随机序列产生
CONSORT 条目 8a:产生随机分配序列的方法。
示例:“通过使用 Stata 软件(StataCorp,CollegeStation,Tex)中的“-ralloc-”命令[20]完成随机化”。
解释:随机数通常是由随机表或能产生随机序列的软件生成的。作者必须清楚描述随机数字表是如何生成的,以便读者判断该随机方法是否合适。
CONSORT 条目 8b:随机方法的类型,任何限定的细节(如怎样分区组和各区组样本多少)。
示例:“在 20 例患者的随机排列区组中,确保两组均匀分布”。
解释:牙科临床研究中常使用简单和排列区组随机、分层随机和最小化法等几种方法[29]。简单随机就像掷硬币一样,尽管它是最安全的方法(因为它确实是随机的),但是在小型试验中,两个治疗组样本量不一致的可能性很高。根据区组的大小,使用区组排列可确保治疗组接近平衡,而分层随机化或最小化法可使治疗组在重要结局指标方面保持平衡。
作者应清楚地描述随机方法及应用的任何限制。使用排列区组时,也应指出区组大小以及其大小是固定的还是可变,因为这会影响后续分配的可预测性。
1.3.6.2 分配隐藏
CONSORT 条目 9:用于执行随机分配序列的机制(例如按序编码的封藏法),描述干预措施分配之前为隐藏序列号所采取的步骤。
示例:“使用顺序编号、不透明、密封的信封(包含试验前准备的治疗分配卡)实现分配隐藏”。
解释:分配隐藏确保患者和研究者对治疗分配的不可预测性,并且是持续有效的,这与盲法不同,盲法通常很难在牙科试验中实施[30]。分配隐藏的方法可以包括使用顺序编号的密封不透明信封或外面资源中心协助分配设置。分配隐藏的最佳方法是使用独立的中央随机分配方案。中央随机的好处在于:研究使用的随机化分配表被安全地保存在距离研究实施地点较远的位置,减少了随机化分配方案泄密的可能。
1.3.6.3 实施
CONSORT 条目 10:谁产生随机分配序列,谁招募受试者,谁给受试者分配干预措施。
示例:“在打开信封之前,基线信息已记录在外面。执行人员负责按顺序打开下一个信封并执行随机化过程”。
解释:随机化的实施过程中包括人员、时间、地点以及随机程序(生成随机化列表,分配隐藏和治疗分配)。在小型临床研究中,可能由同一位研究人员执行所有任务。但是,最好让不同的研究者来执行单独的随机程序,因为这样会减少该过程产生偏倚的机会。
缺乏适当的随机化和分配隐藏可能会引入偏倚,从而使研究结果受到质疑[30]。在各种研究设计中,RCT 被认为是提供最高质量临床证据的试验方法。然而,在包括牙科在内的生物医学文献中,有充分的证据表明,已发表研究的随机化和 RCT 质量总体上不达标,且通常错误地给临床试验贴上 RCTs 的标签[5,31]。因此,需要对随机化所有要素进行清晰描述,以使具备专业知识的读者能够评估试验方法的严谨性。
1.3.7 盲法
CONSORT 条目 11a:如果实施了盲法,分配干预措施之后对谁设盲(例如受试者、医护提供者、结局评估者),以及盲法是如何实施的。
示例:“无法对患者或施术者实行盲法”。
解释:作者应描述对谁设盲(患者,研究人员,结局指标评估者或数据分析员)。差异性随访(表现偏倚),结果记录(检测偏倚),随访脱落(失访偏倚)以及与缺乏盲法相关的数据分析可能会使试验结果产生偏倚[32]。有关盲法的描述千差万别,令人困惑;因此,鼓励提供清晰的盲法解释,而不是使用“单盲”或“双盲”之类的术语[33]。提供具体信息可使读者更好地评估潜在偏倚风险。如果有多个结局,则每个结局都必须有清晰地盲法描述。
CONSORT 条目 11b:如有必要,描述干预措施的相似之处。
示例:“不可能对患者或施术者实现盲法;但是,对结局评估者实行了盲法,因为无法区分光固化法和化学固化法”。
解释:作者应清楚地报告(如果适用)实行盲法的干预措施之间的任何相似之处以利于盲法的实施。在牙科方面,干预措施通常差异很大。但是,甚至在干预措施完全不同的情况下,如该结局评估者没参与试验过程,对结局评估者施盲是可行的。不建议对盲法的有效性进行测试,因为测试结果可能反映了对干预效果的准确估算[34],或者已知的折衷妥协方案的计算等,例如在试验进行过程中任何时点的破盲情况。
1.3.8 统计方法
CONSORT 条目 12a:用于比较各组主要和次要结局指标的统计学方法。
示例:“使用统计方法对两种技术粘合的舌侧固定器的维持时间进行了比较,以进行维持率分析。使用了秩和检验,并绘制了 Kaplan-Meier 图。使用 Cox 回归模型计算危险比(hazard ratios,HRs)和相关的 95%可信区间(confidence intervals,CIs)。Nelson-Aalen 图用于评估比例风险假设”。
解释:提供已实施统计分析的详细描述。
原则是提供“足够的详细信息,以使具备专业知识的读者可以访问原始数据以验证报告的结果”(www.icmje.org)[1,35]。同样重要的是描述每个统计分析中包括的人员详细信息,而不是依赖模糊的标签,如意向性治疗(intent-to-treat,ITT)分析等[36]。此外,应提供对任何缺失数据处理的清晰描述,并阐明分析是否遵循符合方案集分析(per-protocol principle,PP)或 ITT 分析原则[36,37]。ITT 分析是指对所有受试者均根据最初预设分配给他们的干预措施进行分析,而不管他们是否接受了该干预措施。ITT 在有效性评估中(尤其是在实用性临床试验中)受到青睐,因为它们反映了在实践中进行干预时很可能会发生的依从性问题和治疗变更,以及由于将受试者排除在分析范围之外而导致的随访偏倚风险。ITT 分析要求即使受试者没有完全遵守该方案,也要将其包括在内。ITT 的一个重要问题是受试者的缺失数据。
有关 ITT 分析的术语令人困惑,并且通常由不同作者以不同方式解释。因此,清楚地描述数据分析的机制比简单提及“ITT”或“符合方案分析”或其他替代提法(如已接受治疗的、可获得的、连续的患者)更可取。如果缺少数据,则应对任何合理情形下的归因分析、敏感性分析进行报告和结果对比[36,37]。
示例中的 RCT 报告,除在统计方法支持下评估了研究假设,还清楚地概述了用于数据分析的具体方法。此外,对缺失数据的处理和敏感性分析也进行了讨论,对粘合剂的粘着残余指数进行了二次分析,但没有进行亚组分析。
标准分析方法假定数据是“独立的”。对于 RCTs 而言,这通常意味着每个受试者只有 1 个观察值。将来自单个受试者的多个观察结果视为独立数据是一个严重的错误;比如在牙科的临床试验中,当可以在身体的不同部位测量结局指标时,就会产生此类数据。数据分析应该基于对每个受试者进行的单次计数,或者应该用适用于非独立数据的更复杂的统计程序完成分析[13]。经验表明:对统计方法描述不明确,非独立的观察结果(如患者嵌套的托槽脱落)常常被不当地视为独立的观察结果[38,39]。
CONSORT 条目 12b:附加分析的方法,诸如亚组分析和校正分析。
示例:“缺失数据通过使用干预措施的类型,性别和年龄等变量来弥补的。填补是在假设随机缺失的情况下进行的:也就是说,假设在给定的干预措施类型、性别和年龄下,不管我们是否能够观察到,结果指标的分布是相同的。使用适用于 Cox 回归的“-mi-”系列命令来实现填补。使用 Fisher 精确检验比较了复合材料之间的粘合剂残留指数得分”。
解释:随着统计检验次数的增加,出现假阳性结果的可能也会增加,意识到这一点十分重要[21]。尽管不鼓励进行多个亚组分析,但它们在牙科试验中很常见[40],并可能导致选择性报告阳性结果和错误的解释[20]。作者应限制亚组分析的数量,并应明确指出这些分析是预先指定的还是事后的或探索性的。
1.4 结果
1.4.1 受试者流程
CONSORT 条目 13a:随机分配到各组的受试者例数,接受已分配治疗的例数,以及纳入主要结局分析的例数。
示例:“图 1 是 CONSORT 流程图示例,显示了患者通过试验的流程”。

解释:流程图是一种快速的视觉辅助工具,可显示受试者在试验不同阶段的流程。随访期间的任何脱落,平衡的或不平衡的,以及合格受试者数量,随机分组和患者统计分析都很容易观察到。
CONSORT 条目 13b:随机分组后,各组脱落和被剔除的例数,并说明原因。
示例:“220 例患者(中位年龄 16 岁;四分位间距 2 岁;范围 12~47 岁)以 1∶1 的比例随机分配到化学粘合剂治疗组或光固化治疗组;16 例患者在随访中脱落(图 1 和2)。研究于 2009 年 4 月开始招募患者,并于 2010 年 11 月结束”。

解释:作者应明确报告随机化后的脱落和排除,并说明原因。这样就可以评估排除的合理性[41]。此外,还可以计算出样本量减少导致的检验效能损失。
示例中的 RCT 包括一个流程图,其中包含与受试流程和随访脱落有关的特定信息。
CONSORT 条目 14a:招募期和随访时间的长短,并说明具体日期。
示例:“招募患者从 2009 年 4 月开始,到 2010 年 11 月结束”。
解释:报告受试者招募的时间和持续时间提供了历史背景,可能对未来的研究者有价值。在某些试验中,特别是在评估结局发生时间的研究中,并非所有受试者的随访时间都是固定的;相反,随访可以在预先指定的时间点结束,也可能在观察到固定数量的结局事件时结束。
CONSORT 条目 14b:为什么试验中断或停止。
解释:按计划完成的试验结果比过早结束的试验结果更值得信任,特别是在根据数据做出决定的情况下。作者应明确指出试验是否提前结束,包括有关提前终止时间和原因的信息。
示例中的这项研究并未提前终止,并且包含了招募和随访的细节。
1.4.2 基线数据
CONSORT 条目 15:用一张表格列出每一组受试者的基线数据,包括人口学资料和临床特征。
示例:“表中报告了各治疗组患者的基线特征。”(图 2 是报告基线特征表的举例)。
解释:如果随机化已正确进行,则各治疗组的基线特征应相似。收集的所有受试者的基线数据可能包括人口统计学变量(即年龄,性别和种族)和临床特征,包括错位咬合的类型,牙列拥挤的基线测量值和口腔卫生状况。基线数据应在随机分配之前收集,以使数据收集不受对治疗分配的了解的影响。例如,支持较新治疗方法的研究者可能会不自觉地以有偏倚的方式记录基线数据(如增加或减少拥挤的数量),并以某种方式证明对新治疗方法有先入之见。
表格中显示的基线数据可以快速评估各组受试者之间的相似性。组间基线特征的微小差异是随机的,特别是在小型试验中。各组受试者之间基线的重大差异可能与随机分配不当有关。
对于连续变量,例如磨牙间宽度或牙根长度,应包括均值(标准差)或中位数(四分位间距)。不应使用标准差和可信区间来报告变异性,因为它们是推断性的,而不是描述性的。不应将具有少量排序类别的变量视为连续变量;相反,应报告每个类别的数量和比例[1]。不建议进行旨在评估各组之间基线特征平衡的统计测试,这可能会产生误导[42]。明智的做法是,基线比较时应考虑所测变量的预测强度,以及任何随机误差的大小[42]。
1.4.3 纳入分析的例数
CONSORT 条目 16:各组纳入每一种分析的受试者数目(分母),以及是否按最初的分组分析。
示例:“最后 1 例患者入院两年后,用化学固化胶粘剂的 110 个固定器中有 47 个(42.7%)和 110 个固定器中有 55 个(50.0%)失败了。初步分析是在意向性分析的基础上进行的,涉及所有在估算缺失数据后被随机分组的患者。”(图 3 是一个示例表,报告了失效数量和随访时间)。

解释:应明确所有分析中的每组受试者人数。对于二分类变量(即风险比和风险差),也应该报告计算之前的分母或事件发生率。将结果表示为分数有助于读者评估一些随机分配的受试者是否被排除在分析之外。因此,结果不应仅仅作为诸如相对风险之类的简要度量来呈现。
1.4.4 结局和估算
CONSORT 条目 17a:各组每一项主要和次要结局指标的结果,效应估计值及其精确性(如 95% 可信区间)。
示例:“根据估算数据得出的危险比[HR=1.15,95%CI(0.88,1.70),P=0.47]。没有证据表明年龄可能是舌侧固定器失效的重要预测指标[HR=0.96,95%CI(0.93,1.00),P=0.08]。填补数据分析得出两者的 HR 相似;未填补数据假设删除了所有缺失值。在 102 例(64.7%)的失效受试者中,只有 66 例(64.7%)测量了粘着残余指数评分,且复合材料之间没有差异(Fisher精确检验,P=0.16);大多数已确认的失效都发生在釉质黏附层。”(图 4 是一个示例表,报告了来自 Cox 回归的危险比)。

解释:对于主要结局指标,作者应为每组结局指标做总结式报告(如发生或未发生事件的受试者数量,或测量的平均值和标准差),再加上组间的对比,也就是效应大小。对于二分类变量,效应大小可以是相对风险,相对风险降低率,优势比或风险差异。对于维持时间数据,可以用危险比或中位维持时间差来度量。对于连续数据,效果度量通常是平均值的差异。作者应该提供组间对比的可信区间,并作为估计效果的精度(不确定性)的度量。从结果中获得的临床相关性更强、更重要的信息是实际差异或效应大小及其不确定性。P值虽然在统计学上有显著意义,但对提供临床相关性的认识作用有限。报告可信区间将结果的解释从重要或不重要的二分法转移到效应的大小或相关性,以及研究数据给出的合理值范围[1]。对于配对对照设计(如左右侧对照),应提供患者间的相关系数,以指导今后的样本量计算[12]。同样,对于具有整群效应的设计,应提供群组内相关系数或变异系数(k)[13, 43]。
CONSORT 条目 17b:对于二分类结局,建议同时提供相对效应值和绝对效应值。
示例:“最后 1 例患者入院两年后,用化学固化胶粘剂的 110 个固定器中有 47 个(42.7%)和 110 个固定器中有 55 个(50.0%)失败了(风险差异:7.3%,95%CI:5.9%,20.5%)。
解释:对于二分类数据,最好同时提供绝对风险和相对风险,因为孤立地解释二者会产生误导[44]。例如,两风险之差(4%−2%=2%),两风险之比(风险比,4/2=2)。然而,风险之间较大的绝对差异(40%−20%=20%)可能在比率量表中呈现相同的差别(风险比,40/20=2);但是,基于绝对差异(2%vs. 20%)的解释可能会完全不同。相对比例的效应估计(如风险比和优势比)在整个人群中比风险差异(比例差异)更具普遍性,因为后者取决于对照组的基线风险,而基线风险随人群而变化。
示例中的研究在填补缺失数据后,根据 ITT 原则对患者进行了分析。提供了主要比较的估计危险比和绝对风险差异以及相关的 95%可信区间。对于次要结局(粘着残余指数),仅提供了纳入分析的例数和P值,因为只有 66%的失效例数进行了该结局指标的测量。
1.4.5 辅助分析
CONSORT 条目 18:所做的其他分析的结果,包括亚组分析和校正分析,指出哪些是预先设定的分析,哪些是新尝试的分析。
示例:“在 102 例(64.7%)的失效病例中,只有 66 例(64.7%)有可能出现粘着残余指数评分,且复合材料之间没有差异(Fisher 精确检验,P=0.16);大多数已确认的失效都发生在釉质粘附层”。
解释:临床试验的受试者在人口统计学或临床基线特征方面存在差异,可能影响对干预措施的治疗反应。可以进行亚组分析,以确定治疗效果是否因于各组患者的基线特征而异,如相同性别、年龄、社会经济地位、口腔卫生以及与矫正治疗的依从性等。随着统计分析数量的增加,观察到某些假阳性结果(多重性问题)的可能性也会增加[21]。亚组比较结果的报告可能会被人为操控,过分强调阳性结果会产生对治疗效果的错误印象。理想情况下,应该预先指定亚组分析的方法[20]。同样,对基线变量的任何调整最好是预先计划指定的;应当说明这些措施的实施是否是因为观察到了基线的不平衡才增加的。
1.4.6 危害
CONSORT 条目 19:各组出现的所有严重危害或意外效果(具体的指导建议参见“CONSORT for harms”)。
示例:“除了与牙菌斑积聚相关的牙龈炎外,未观察到严重危害”。
解释:在评估支持或不支持某项干预措施有效性的证据时,利益和危害之间的平衡是一个重要的考虑因素。因此,应提供评估的治疗组危害及其发生频率的清晰描述。可提供关于 RCTs 中报告危害的 CONSORT 声明扩展[22];在本案例的试验中,除与牙菌斑积聚有关的牙龈炎外,没有其他危害。
1.5 讨论
1.5.1 局限性
CONSORT 条目 20:试验的局限性,报告潜在偏倚和不精确的原因,以及出现多种分析结果的原因(如果有这种情况的话)
示例:“我们的研究局限性在于不可能对所有患者进行失效性检查,尤其是在研究即将结束时”。
解释:在讨论部分中,应提及试验的局限性,尤其是潜在的偏倚来源,包括测量偏倚和失访偏倚。应当参照报告的可信区间讨论观察到的效应计算的不精确度;应将重点放在临床意义上,而不是在P值和统计学意义上[37,44,45]。
同样,应更多地注意对主要的、预先规定的结局指标的分析;应谨慎解释亚组分析和多次测量后的结果[45,46]。
1.5.2 可推广性
CONSORT 条目 21:试验结果被推广的可能性(外部可靠性,实用性)
示例:“这些结果的普遍性可能受到限制,因为这项研究是由一位在化学固化粘合法和光固化粘合法方面都有经验的临床医生(N.P.)在一个中心进行的。”
解释:只要试验的纳入和排除标准相似,且在一致的生物学反应假设下将试验结果适用于其他环境和人群通常是可行的[15,47]。例如,美国的一项 RCT 评估了仅在成人受试者使用的自酸蚀处理剂或传统酸蚀法粘结的托槽失效,其结果适用于英国成人吗?也许是的。同样的结果适用于青少年吗?成人和青少年之间的依从性差异可能会影响结果;因此,在评估外部效度时应考虑与年龄有关的差异。
外部效度取决于内部效度。因此,如果由于偏倚的方法导致试验结果无效,那么外部效度问题就无从谈起了。外部效度取决于受试者的背景和特征、干预措施和试验结果,因为它们由纳入和排除标准决定。
1.5.3 解释
CONSORT 条目 22:与结果相对应的解释,权衡试验结果的利弊,并且考虑其他相关证据。
示例:“尽管注意到固定器失效率没有显著差异,但记录的失效数量相当可观,在脱胶后的两年内从 43%到 50%不等。这种多数失效的情况与最近的预期相符”。
“我们相对较高的失效率可能与前瞻性设计和相对冗长的随访有关。同样,任何损坏都被记录下来;因此,即使是造成轻微后果的小裂缝(甚至在其它回顾性研究中可能被忽略)也已作为失效记录在该研究中”。
解释:讨论应该把证据作为一个整体来考虑,最好是在系统评价的背景下,而不是仅仅关注当前的试验或选定的研究,也许是那些研究正好证实了本试验结果的研究。
本例示范试验在现有证据的背景下讨论了结果,强调了研究的局限性以及延长随访时间的复杂性,并对结果的可推广性发表了评论,因为这种治疗仅限于 1 名经验丰富的操作者。
1.6 其他信息
1.6.1 注册
CONSORT 条目 23:临床试验注册号和注册机构名称。
示例:“该试验未注册”。
解释:为了最大程度地减少数据的不发表和保留,选择性报道以及重复出版的可能性,国际医学杂志编辑委员会要求试验必须进行注册才能出版。
这一立场导致注册的试验数量急剧增加。在报告试验摘要时,作者应提供试验注册号码和试验注册名称的详细信息[48]。这使读者能够获得有关试验及其结果的更多信息。注册信息还有助于将报告与后续的完整出版物(或同一试验的多个报告)链接起来,从而降低了系统评价中无意识重复计算的风险。
未注册的试验继续在 AJO-DO 中发表;这使得未注册的正在进行的试验有机会被发表。目前,临床试验未注册,其试验结果不会被刊登。关键在于临床试验注册是否透明。但是,这种情况将来可能会改变。因此,强烈建议研究人员从一开始就注册临床试验(例如,通过北美平台 ClinicalTrials.gov 进行注册)[49]。
1.6.2 方案
CONSORT 条目 24:如果有的话,在哪里可以获取完整的试验方案。
示例:“该临床试验方案未在试验开始前发表”。
解释:预发表临床试验方案很重要,因为它提供了试验的所有计划细节。将方案置于公共领域允许对预期和实际完成进行比较,因此不鼓励只对阳性的结果进行选择性报告[20]。方案的发表还向科学界通报了计划中的和正在进行的试验,并为研究人员和系统评价作者提供了更好的交流和更高的效率。SPIRIT 指南详细描述了起草 RCT 研究方案的要求[50]。
理想情况下,应该明确临床试验方案是否可以获得以及在何处可以获得。透明度至关重要;CONSORT 声明专注于准确地报告在研究期间所做的事情,而不是对此进行判断。
1.6.3 资助
CONSORT 条目 25:资助和其他支持(如提供药品)的来源,提供资助者所起的作用。
示例:“没有宣布资助或利益冲突”。
−资助和其他形式的支持应明确声明。研究表明,与其他来源资助的研究相比,由制药业赞助的试验具有使结果偏向赞助者的比率更高[51]。通常,资助来源在摘要的末尾或文章“致谢”部分进行报告。
2 摘要
在本说明性文章的最后一节中,我们将按照 CONSORT 的摘要指南,介绍如何报告随机对照试验的摘要[3]。这些条目已在上文进行了描述;然而,由于矫正摘要通常报道不完整,因此有必要简短描述[6]。
表 2 中列出了摘要中需包含内容的清单。要点如下。
① 清楚阐释试验设计的一个重要原因是要确保在电子数据库中建立适当的索引,以使试验更被容易识别。例如:“双臂平行试验”。
② 清晰描述受试者及试验环境,以便读者评估试验的外部效度(推广性)并确定其对自身环境的适用性。示例:“纳入标准包括下颌前牙没有活动性龋齿,修复或断裂,以及足够的口腔卫生”。
③ 应描述每个试验组和对照组干预措施的基本特征。示例:“在私人矫正诊所接受过矫正治疗的患者被随机分配应用化学固化复合材料或光固化复合材料固定器”。④ 摘要应清楚描述试验中涉及的特定目标或研究假设。示例:“该试验的目的是比较在矫正治疗后用化学固化或光固化粘合剂粘结的舌侧固定器的维持率”。
⑤ 作者应明确说明试验的主要结果以及何时进行评估(如评估结果的时间范围)。例如:主要结局指标是任何类型的第一次舌侧固定器损坏;失效的情况种类(粘着残余指数评分)是次要结局指标。患者分别在 1、3、6 个月和放置固定器后每 6 个月复查一次,直到研究结束。
⑥ 重要的是详细介绍随机序列生成方法,随机化方法和实施的限制,以及从受试者分配到干预组中隐藏分配序列的细节。分配隐藏可以防止研究人员影响受试者分配到干预措施组的选择(即选择偏倚)。示例:“随机分组是对 20 位患者进行随机区组排列完成的,其分配隐藏在顺序编号、不透明的、密封的信封中”。
⑦ 作者应说明受试者,干预措施的实施者(通常是卫生保健提供者)和评估结果的人员(数据收集者和分析人员)是否对分组方案知情。示例:“盲法仅适用于结果评估”。
⑧ 应明确随机分配到每个干预措施组的受试者人数,因为这是试验结果的重要组成部分。该数字规定了样本量,读者可以使用它来评估最终分析中是否包括所有被随机分配的参与者。示例:“220 例患者(中位年龄 16 岁,四分位间距 2 岁,范围 12~47 岁)以 1∶1 的比例随机分配到化学粘合剂组或光固化粘合剂组”。
⑨ 对于主要结局指标,作者应将每组结局指标做总结式报告(如发生或未发生事件的受试者数量,或测量的均数和标准差),再加上组间的对比,也就是效应大小。对于二分类结局,效应大小可以是相对风险,相对风险降低率,优势比或风险差。对于维持时间数据,可以用危险比或中位维持时间差来度量。对于连续数据,效果度量通常是平均值的差异。作者应该提供组间对比的可信区间,并作为估计效果的精度(不确定性)的度量。示例:“在至少两年的随访中,用化学固化胶粘剂的 110 个固定器中的 47 个(42.7%)和 110 个固定器中有 55 个(50.0%)发生了某种类型的失效(对数秩检验,P=0.35)。在意向治疗分析的基础上分析数据,危险比(HR)为 1.15[95%CI(0.88,1.70),P=0.47]。没有证据表明年龄可能是舌侧固定器失效的重要预测指标[HR=0.96,95%CI(0.93,1.00),P=0.08]。在 102 例(64.7%)的失效中,只有 66 例(64.7%)进行了粘着残余指数评分,且复合材料之间没有差异(Fisher 精确检验,P=0.16)”。
⑩ 要做出平衡的决定,读者需要有关干预措施的疗效和安全性的信息。摘要中应提及干预措施的重要危害(或意想不到的)影响。如果没有发生重大不良事件,作者应明确说明。示例:“除了与牙菌斑积聚相关的牙龈炎外,未观察到严重危害”。
⑪ 试验结论应与摘要中报告的结果一致,并应明确说明其临床应用(避免泛化)。在适用的情况下,作者还应注意,将结果用于临床前是否需要进行其他研究。示例:“这项研究的结果表明,没有证据表明应用化学和光固化胶粘剂的下颌舌侧固定器的维持率存在差异。总体失效率为 46.4%;然而,这包括任何类型的失效,可能夸大整体失效率”。
⑫ 尽管不是 CONSORT 声明条目,但应记录试验注册和临床试验方案的详细信息,以及说明资金来源。例如:“该试验未注册”,“在试验开始前未发表该方案”或“未声明资助或利益冲突”。
3 结论
在做出临床决策时,循证牙科方法将现有最佳证据、临床专业知识以及患者的偏好和价值观融合在一起。高质量的随机对照试验是系统评价的基础,应置于循证决策的最前沿。完整透明的试验报告有助于准确评估研究质量和正确解释结果。此外,通过明确的报告,可以更快速地确定适合纳入系统评价的研究、评估初步研究结果以及提取数据。经验表明,医学和牙科领域的 RCTs 报告质量仍然不是最理想的,并且受到未发表、不完整、选择性和误导性的报告的不良影响。CONSORT 指南为这些问题提供了有影响力的重要解决方案,在报告矫正临床试验时应遵循该指南,而且,这一指南还可以指导试验的设计和实施。
参考文献:见原文。
随机对照试验(randomized controlled trials,RCTs)是循证医学的组成部分。随机对照试验报告的读者必须能够准确理解试验是如何进行的,以评估研究结果的相关性和方法学的严谨性。研究报告有两个关键原则:一是依据报告提供的信息可以重复试验,二是方法和结果应得到足够详细地描述,以便纳入系统评价[1]。
CONSORT 声明是为了帮助改善随机对照试验的报告质量,为准备报告临床试验的研究人员提供指导。CONSORT 清单由 25 个条目组成,涵盖临床试验的所有关键要素,为如何报告此类研究的设计、实施、分析和解释设定了标准[2]。CONSORT 指南的一些扩展版涵盖了更复杂的试验设计,如整群随机试验和非劣效试验;其最新信息可在 CONSORT 网站上获得(http://www.consort-statement.org/extensions)。超过 600 家生物医学期刊,包括 2004 年的《美国矫形和口腔矫正杂志》(American Journal of Orthodontics and Dentofacial Orthopedics,AJO-DO)已采用了 CONSORT 声明,同时许多期刊也采纳了关于报告摘要的 CONSORT 规范。尽管这些建议被广泛接受,但临床试验的报告质量仍有相当大的改善空间[4-8]。
AJO-DO 认识到,采纳 CONSORT 声明并不意味着能确保遵守。在 2011 年实施了一项计划,旨在改善对 CONSORT 的依从性,从而提高 AJO-DO 杂志对随机对照试验的报告质量。该计划包括视频、CONSORT 网站链接,以及为提交有关遵从 CONSORT 规范 RCTs 报告的作者的积极指导。最近,AJO-DO 对 RCTs 的报告重新规定了格式,引入了副标题,以促进完整的报告,进而能够更有效地在系统评价过程中提取相关临床数据。
自从 AJO-DO 引入这些改变以来,其发表的 RCTs 在报告质量方面已有了很大改善;这些改善反映了编辑、审稿人和作者之间的成功互动[9]。在 2011 年至 2013 年期间提交的所有已发表试验中,报告了 37 个 CONSORT 条目及其子条目中的 33 个。但 CONSORT 中涉及方法变更(3b)、试验开始后的结局指标变更(6b)、中期分析(7b)和试验终止(14b)的条目没有充分地报告。故仍有必要加强作者首次提交的试验报告质量,从而大大节省为提高对 CONSORT 报告规范依从性的编辑工作。本文旨在解释 AJO-DO 对 RCTs 试验报告提交的要求,并描述和说明 CONSORT 清单中每个条目的重要性,以及它与牙科矫正临床试验的相关性。本文的基础是报告两组平行随机对照试验的 CONSORT 2010 解释与说明文件[2]。一个遵从 CONSORT 报告规范的已发表 RCT 已上传到 AJO-DO 网站(注释随机对照试验样本文章),并将作为解释示例。
1 清单条目及其重要性的说明
以下解释以 CONSORT 声明解释与说明文件为基础,并进行了适当调整,以更好地针对 AJO-DO 的读者(表 1)[2]。

1.1 标题和摘要
CONSORT 条目 1a:文题能识别是随机临床试验。
示例:“化学聚合(I)或光聚合(C)法对矫正患者(P)固定器的 2 年内维持度(O)对比研究;单中心随机对照临床试验。”
解释:为了帮助确保研究被适当索引和容易识别,作者应该在标题中使用“随机”一词,以表明参与者被随机分配到治疗组与对照组[10]。鼓励作者(此处不属于 CONSORT 的要求)以 PICO+格式组织标题,提供关于参与者、干预措施、对照和结局的信息。+表示可能包含与盲法、中心数、时间等相关的附加信息。
CONSORT 条目 1b:结构式摘要,包括试验设计、方法、结果、结论几个部分(具体的指导建议参见“CONSORT for abstracts”)。
解释:RCT 摘要的报告有具体的指导(表 2)。文笔流畅、详细且清楚地描述试验的摘要有助于对一篇文章的初步评估,便于从数据库中检索试验以纳入系统评价中。摘要是许多临床医生阅读文章的唯一要素,因此其准确性和质量至关重要。鉴于几乎所有与摘要有关的信息都将在主要 CONSORT 规范条目项下详细讨论,本文将在结尾部分考虑摘要条目的报告。

1.2 引言
引言部分包括背景和目的。
1.2.1 背景和目的
CONSORT 条目 2a:科学背景和对试验理由的解释。
示例:“粘合失败仍然是一个严重的问题,失败率估计为 6%~25%,这取决于放置技术和观察周期。尽管光固化材料提供了更长的有效时间并改善了对湿度的控制,但尚未有调查这些理论优势重要性的随机对照试验发表。”
解释:在试验设计阶段的良好习惯首先是检索文献以识别有关感兴趣主题的可获得证据。所检索到的资料可能有限,也可能很多;如果可能,最好能够找到高质量的系统评价。近期的高质量系统评价总结了现有的临床证据,可作为已知和未知的有关感兴趣干预措施有效性和安全性证据的参考。赫尔辛基宣言认为:在没有充分了解现有文献的情况下进行人体研究是不道德的,设计一项试验来回答已经被回答过的问题也是不道德的,只有现有证据不确定当前干预措施有效性时,这项试验研究才是恰当的[11]。
在本文的 RCT 范例中,虽然未引用系统评价结果,但作者明确指出,尚未有任何已发表的 RCT 探讨光固化法对照化学固化法的优劣。
CONSORT 条目 2b:具体目的和假设。
示例:“在这项研究中,我们旨在比较在矫正治疗后使用化学聚合或光聚合作用固定的下颌舌侧固定器的维持率。”
解释:试验的目标旨在设计试验解决问题,它们通常与特定治疗或预防性干预措施的效应有关。研究假设是预先确定的,通过试验检验以达到试验目标。研究假设比研究目标更为具体,并且可以进行明确的统计评估。实际上,研究目标和研究假说常常不易分辨。
1.3 方法
1.3.1 试验设计
CONSORT 条目 3a:描述试验设计(诸如平行设计、析因设计),包括受试者分配入各组的比例。
示例:“这是分配比例为 1∶1 的平行、随机、阳性对照试验。”
解释:最常见的试验设计类型是平行设计;但是,还应注意交叉试验设计、整群随机化设计、非劣效性检验、析因设计及混合设计等类型的临床设计。牙科中常用的研究设计有左右侧对照设计[12],有的研究还包括整群设计要素。当从每个患者的多个部位和组织中收集到多个观察结果(如牙齿或牙周部位或组织的数量)时,这种设计就会被应用[13]。不同试验设计的试验实施和分析的特征不同。因此,应详细说明这些试验设计的细节。提供特定细节(设计和分配比例)是十分重要的,如本条目示例所示。
CONSORT 条目 3b:试验开始后对试验方法所作的重要改变(如合格受试者的挑选标准),并说明原因。
示例:“开始试验后,没有对方法进行更改。”
解释:研究方案和实际执行方式之间的差异是很常见的,应恰当记录在案。设计发生变化(例如,纳入与排除标准或随访时间)的可能原因很多,包括新的外部证据\无法招募足够多的患者以及财务拮据等。对于某些“适应性”试验,如果在研究开始前未确定试验的样本量和研究的周期,研究方案允许遵循预定的规则进行有限的更改。研究方案应列出在不同情况下预设的方案调整,并且应在发表的文章中对这些变更予以记录、解释和说明[14]。对试验设计的任何变更均应完整报告,以帮助读者理解其结果,无论这种变更是方案中预知的还是因不断变化的情况导致的。
在试验开始后,示例的这项 RCT 未报告这些变化。但是没有发表的试验方案允许对此进行验证,并且在摘要结尾进行报告。
1.3.2 受试者
CONSORT 条目 4a:受试者合格标准。
示例:“采用了以下选择标准:下颌前牙没有活动性龋齿、修复体或骨折;没有牙周疾病;足够的口腔卫生。”
解释:应明确概述受试者和环境的合格标准以及相关信息,因为它们会影响试验结果与其它环境的相关性(适用性)。由于合格标准在随机分配之前应用,因此它们不会影响试验的内部效度(方法学质量)[15]。将纳入标准和排除标准进行区分不是必需的;可以用相同的标准对纳入或排除的受试者进行表述[16]。
CONSORT 条目 4b:资料收集的场所和地点。
示例:“自 2009 年 4 月至 2010 年 11 月,第一作者(N.P.)在私人诊所连续招募了使用固定矫治器完成矫正治疗的患者。”
解释:清楚地描述收集数据的环境和场所对于读者判断调查结果是否与自己的环境有关很重要。还应明确说明地理位置、参与中心数量、可用设施、相关护理提供者及其专业水平的信息。例如,在拥有最先进设施、训练有素的人员的中心和由设备简陋的诊所中新手进行的研究之间,试验结果可能会有很大的不同[15]。
1.3.3 干预措施
CONSORT 条目 5:详细描述各组干预措施的细节以使他人能够重复,包括它们实际上是在何时、如何实施的。
示例:“所有患者均接受在口内制备的 0.022 英寸(软质舌侧固定器 Tru-Chrome 多股线;Rocky Mountain 矫正,丹佛市,科罗拉多州)”。在化学聚合治疗组中,将 Maximum Cure2-部分液体粘合剂(Reliance 矫正产品,伊塔斯卡市,伊利诺伊州)混合并应用于丝线和牙齿上,Excel2-部分糊剂(Reliance 矫正产品)混合,用注射器施用。在光聚合治疗组中,将光固化液体(Assure;Reliance 矫正产品)和两层糊剂(Flow-Tain;Reliance 矫正产品)放在金属丝和相邻的瓷漆上,每颗牙使用等离子灯(Ortholite;3MUnitek,蒙罗维亚,加利福尼亚)进行 9 秒光固化。
解释:应提供每种干预措施足够详细的清晰描述,以使有经验的研究人员能够重复该试验[17]。例如,在一项多中心试验中,至少应概述给药的确切方法、持续时间和治疗时机[18]。药物干预需要解释给药方式、剂量和频率,以及无论对照或安慰剂在形状、颜色、气味和味道方面与“有效药物”都没有区别。对于其他类型的干预措施,CONSORT 用于非药物试验的扩展描述了报告要求[19]。干预措施的标准化、干预措施各个组成部分的描述以及如何评估研究者依从性都十分重要。清晰描述将进一步促进将有效比较和决策纳入系统评价[17]。
1.3.4 结局指标
CONSORT 条目 6a:完整而确切地说明预先设定的主要和次要结局指标,包括它们是在何时、如何测评的。
示例:“主要结局指标是舌侧固定器首次失效。次要结局是根据残留胶粘剂判断失效种类。患者被建议在放置固定器后的 1、3、6 个月开始去看牙科矫正医生,然后在 12、18、24 个月安排随访。当预定的预约不可行时,特别是在试验快结束时,可通过电话对固定器的完整性进行评估。”
解释:试验通常有几种结局指标,一般分为主要结局指标和次要结局指标。应该明确定义和预先规定所有结局指标,并明确说明如何以及何时进行评估。每个结局指标的定义应足够清晰,以允许其他研究者在试验中使用相同的结局指标,或者明确知悉相关结局指标与系统评价中的相关结局指标的异同性。明确预先指定的结局指标,尤其是主要结局指标非常重要,因为与试验注册和方案预发表一样,它减轻了选择性报告“感兴趣的”结局指标的问题,这种可能性在有研究中包含多个结局指标或多个时间点的数据收集时更大[20]。此外,多个结局指标记录及随之而来的多重测试,会引发与多重性和误导性解释相关的系列问题[21]。
在评估支持或不支持某项干预措施有效性的证据时,有效性和副作用之间的平衡是一个重要的考虑因素。应清晰描述所记录的副作用[22]。在非药学试验中,明确结局指标评估的具体方法和开展结局指标评估的人数尤为重要。
CONSORT 条目 6b:试验开始后对结局指标是否有任何更改,并说明原因。
示例:“试验开始后结局指标没有变化。”
解释:已发表文献的回顾研究表明,计划与报告的结局指标之间存在差异[23]。最初计划为原始试验方案的主要结局指标可能被描述为次要结局指标,而在发表的文章中,可能会介绍新的主要结局指标。已有文献报道选择性报告研究结果和将“有意义”的结果报告出来的问题[20]。因此,对任何结局指标变更以及变更原因的清晰描述,将会提高临床试验的透明度。示例所述的 RCT 中,报告结局指标没有变化;然而,也未在预先发表的临床试验方案中证实这一点。
1.3.5 样本量
CONSORT 条目 7a:如何确定样本量。
示例:“样本量的计算是基于检测两个试验组之间首次失效(主要结局指标)风险的临床相关差异达到 20% 的能力(15% vs. 35%,α=0.05,检验效能为 85%)。Foek 等人发现,光固化法舌侧固定器的失效率是 35%。我们将此值用作样本量计算的参考。计算结果表明,每个小组至少需要 93 例受试者,每组将样本量增加到 110 例,以补充随访中可能的患者脱落。”
解释:RCTs 应该具有足够的检验效能来检测试验组之间在临床结局上的重要差异(如果存在差异)或确认治疗措施之间无差异。研究人员有义务根据临床重要性和合理假设进行适当的样本量计算。
作者应提供足够的样本量估算信息,使读者可以重现样本量的计算过程[24, 25]。应明确指出,样本量的计算通常基于主要结局指标。对于连续型变量指标,作者应报告对照组的预期结局,干预组与对照组的预期差异、标准差以及检验水准和检验效能。对于二分类指标,除了标准差外,也需要相同的信息。在预期会产生群组效应的设计中,应提供群组内相关系数的值[26]。对于矫正临床试验中常见的左右侧对照设计,应指明部位之间的假定相关性[12, 27]。最后,还应描述任何有关预期随访脱落的规定。理想情况下,作者应解释样本计算中使用的参数值的来源。
临床研究一般不宜通过事后分析来证明之前的样本量是否合理。但可以通过检查效应量和可信区间以及其表现出的不确定性来判断检验效能[28]。
CONSORT 条目 7b:必要时,解释中期分析和试验中止原则。
示例:“不适用。”
解释:在延长期内招募和治疗受试者。如果在试验早期就出现了不同干预措施效果的明显差异,则出于伦理原因,可能会提前终止临床研究。可以通过中期检查结果来解决这个问题,最好由独立的数据和安全监查委员会来解决。但是,在没有进行适当更正的情况下执行多次统计检查,可能会导致错误的结果和解释[21]。作者应报告他们或数据监测委员会是否对数据进行了数次“检查”;如果是,那么进行了几次,是什么原因诱发他们这么做,使用了什么统计方法(包括任何试验正式的停止规则),以及是否在试验开始前,或在数据监测委员会通过分配看到任何临时数据之前,又或在之后的某个时间进行的数据核查。
在示例研究报告中,未报告任何中期分析或终止的办法。
1.3.6 随机化
与其他前瞻性研究相比,随机化是 RCTs 的主要优势。临床试验方法学中的随机化具有特殊含义,应该加以实施,以使研究者和受试者都无法预测下一个治疗方案的分配。术语“交替分配”、“随机分配”和基于某种确定性度量的分配—如出生日期或星期几—并不被认为是完全随机或足够明确,尽管在牙科文献中经常遇到[5,29]。这种不适当的分配方案不是真正的随机化,而与偏倚的结果有关。随机化过程要求治疗分配是完全随机的,并具有在治疗方案实际被分配前隐藏治疗方案的机制。
1.3.6.1 随机序列产生
CONSORT 条目 8a:产生随机分配序列的方法。
示例:“通过使用 Stata 软件(StataCorp,CollegeStation,Tex)中的“-ralloc-”命令[20]完成随机化”。
解释:随机数通常是由随机表或能产生随机序列的软件生成的。作者必须清楚描述随机数字表是如何生成的,以便读者判断该随机方法是否合适。
CONSORT 条目 8b:随机方法的类型,任何限定的细节(如怎样分区组和各区组样本多少)。
示例:“在 20 例患者的随机排列区组中,确保两组均匀分布”。
解释:牙科临床研究中常使用简单和排列区组随机、分层随机和最小化法等几种方法[29]。简单随机就像掷硬币一样,尽管它是最安全的方法(因为它确实是随机的),但是在小型试验中,两个治疗组样本量不一致的可能性很高。根据区组的大小,使用区组排列可确保治疗组接近平衡,而分层随机化或最小化法可使治疗组在重要结局指标方面保持平衡。
作者应清楚地描述随机方法及应用的任何限制。使用排列区组时,也应指出区组大小以及其大小是固定的还是可变,因为这会影响后续分配的可预测性。
1.3.6.2 分配隐藏
CONSORT 条目 9:用于执行随机分配序列的机制(例如按序编码的封藏法),描述干预措施分配之前为隐藏序列号所采取的步骤。
示例:“使用顺序编号、不透明、密封的信封(包含试验前准备的治疗分配卡)实现分配隐藏”。
解释:分配隐藏确保患者和研究者对治疗分配的不可预测性,并且是持续有效的,这与盲法不同,盲法通常很难在牙科试验中实施[30]。分配隐藏的方法可以包括使用顺序编号的密封不透明信封或外面资源中心协助分配设置。分配隐藏的最佳方法是使用独立的中央随机分配方案。中央随机的好处在于:研究使用的随机化分配表被安全地保存在距离研究实施地点较远的位置,减少了随机化分配方案泄密的可能。
1.3.6.3 实施
CONSORT 条目 10:谁产生随机分配序列,谁招募受试者,谁给受试者分配干预措施。
示例:“在打开信封之前,基线信息已记录在外面。执行人员负责按顺序打开下一个信封并执行随机化过程”。
解释:随机化的实施过程中包括人员、时间、地点以及随机程序(生成随机化列表,分配隐藏和治疗分配)。在小型临床研究中,可能由同一位研究人员执行所有任务。但是,最好让不同的研究者来执行单独的随机程序,因为这样会减少该过程产生偏倚的机会。
缺乏适当的随机化和分配隐藏可能会引入偏倚,从而使研究结果受到质疑[30]。在各种研究设计中,RCT 被认为是提供最高质量临床证据的试验方法。然而,在包括牙科在内的生物医学文献中,有充分的证据表明,已发表研究的随机化和 RCT 质量总体上不达标,且通常错误地给临床试验贴上 RCTs 的标签[5,31]。因此,需要对随机化所有要素进行清晰描述,以使具备专业知识的读者能够评估试验方法的严谨性。
1.3.7 盲法
CONSORT 条目 11a:如果实施了盲法,分配干预措施之后对谁设盲(例如受试者、医护提供者、结局评估者),以及盲法是如何实施的。
示例:“无法对患者或施术者实行盲法”。
解释:作者应描述对谁设盲(患者,研究人员,结局指标评估者或数据分析员)。差异性随访(表现偏倚),结果记录(检测偏倚),随访脱落(失访偏倚)以及与缺乏盲法相关的数据分析可能会使试验结果产生偏倚[32]。有关盲法的描述千差万别,令人困惑;因此,鼓励提供清晰的盲法解释,而不是使用“单盲”或“双盲”之类的术语[33]。提供具体信息可使读者更好地评估潜在偏倚风险。如果有多个结局,则每个结局都必须有清晰地盲法描述。
CONSORT 条目 11b:如有必要,描述干预措施的相似之处。
示例:“不可能对患者或施术者实现盲法;但是,对结局评估者实行了盲法,因为无法区分光固化法和化学固化法”。
解释:作者应清楚地报告(如果适用)实行盲法的干预措施之间的任何相似之处以利于盲法的实施。在牙科方面,干预措施通常差异很大。但是,甚至在干预措施完全不同的情况下,如该结局评估者没参与试验过程,对结局评估者施盲是可行的。不建议对盲法的有效性进行测试,因为测试结果可能反映了对干预效果的准确估算[34],或者已知的折衷妥协方案的计算等,例如在试验进行过程中任何时点的破盲情况。
1.3.8 统计方法
CONSORT 条目 12a:用于比较各组主要和次要结局指标的统计学方法。
示例:“使用统计方法对两种技术粘合的舌侧固定器的维持时间进行了比较,以进行维持率分析。使用了秩和检验,并绘制了 Kaplan-Meier 图。使用 Cox 回归模型计算危险比(hazard ratios,HRs)和相关的 95%可信区间(confidence intervals,CIs)。Nelson-Aalen 图用于评估比例风险假设”。
解释:提供已实施统计分析的详细描述。
原则是提供“足够的详细信息,以使具备专业知识的读者可以访问原始数据以验证报告的结果”(www.icmje.org)[1,35]。同样重要的是描述每个统计分析中包括的人员详细信息,而不是依赖模糊的标签,如意向性治疗(intent-to-treat,ITT)分析等[36]。此外,应提供对任何缺失数据处理的清晰描述,并阐明分析是否遵循符合方案集分析(per-protocol principle,PP)或 ITT 分析原则[36,37]。ITT 分析是指对所有受试者均根据最初预设分配给他们的干预措施进行分析,而不管他们是否接受了该干预措施。ITT 在有效性评估中(尤其是在实用性临床试验中)受到青睐,因为它们反映了在实践中进行干预时很可能会发生的依从性问题和治疗变更,以及由于将受试者排除在分析范围之外而导致的随访偏倚风险。ITT 分析要求即使受试者没有完全遵守该方案,也要将其包括在内。ITT 的一个重要问题是受试者的缺失数据。
有关 ITT 分析的术语令人困惑,并且通常由不同作者以不同方式解释。因此,清楚地描述数据分析的机制比简单提及“ITT”或“符合方案分析”或其他替代提法(如已接受治疗的、可获得的、连续的患者)更可取。如果缺少数据,则应对任何合理情形下的归因分析、敏感性分析进行报告和结果对比[36,37]。
示例中的 RCT 报告,除在统计方法支持下评估了研究假设,还清楚地概述了用于数据分析的具体方法。此外,对缺失数据的处理和敏感性分析也进行了讨论,对粘合剂的粘着残余指数进行了二次分析,但没有进行亚组分析。
标准分析方法假定数据是“独立的”。对于 RCTs 而言,这通常意味着每个受试者只有 1 个观察值。将来自单个受试者的多个观察结果视为独立数据是一个严重的错误;比如在牙科的临床试验中,当可以在身体的不同部位测量结局指标时,就会产生此类数据。数据分析应该基于对每个受试者进行的单次计数,或者应该用适用于非独立数据的更复杂的统计程序完成分析[13]。经验表明:对统计方法描述不明确,非独立的观察结果(如患者嵌套的托槽脱落)常常被不当地视为独立的观察结果[38,39]。
CONSORT 条目 12b:附加分析的方法,诸如亚组分析和校正分析。
示例:“缺失数据通过使用干预措施的类型,性别和年龄等变量来弥补的。填补是在假设随机缺失的情况下进行的:也就是说,假设在给定的干预措施类型、性别和年龄下,不管我们是否能够观察到,结果指标的分布是相同的。使用适用于 Cox 回归的“-mi-”系列命令来实现填补。使用 Fisher 精确检验比较了复合材料之间的粘合剂残留指数得分”。
解释:随着统计检验次数的增加,出现假阳性结果的可能也会增加,意识到这一点十分重要[21]。尽管不鼓励进行多个亚组分析,但它们在牙科试验中很常见[40],并可能导致选择性报告阳性结果和错误的解释[20]。作者应限制亚组分析的数量,并应明确指出这些分析是预先指定的还是事后的或探索性的。
1.4 结果
1.4.1 受试者流程
CONSORT 条目 13a:随机分配到各组的受试者例数,接受已分配治疗的例数,以及纳入主要结局分析的例数。
示例:“图 1 是 CONSORT 流程图示例,显示了患者通过试验的流程”。

解释:流程图是一种快速的视觉辅助工具,可显示受试者在试验不同阶段的流程。随访期间的任何脱落,平衡的或不平衡的,以及合格受试者数量,随机分组和患者统计分析都很容易观察到。
CONSORT 条目 13b:随机分组后,各组脱落和被剔除的例数,并说明原因。
示例:“220 例患者(中位年龄 16 岁;四分位间距 2 岁;范围 12~47 岁)以 1∶1 的比例随机分配到化学粘合剂治疗组或光固化治疗组;16 例患者在随访中脱落(图 1 和2)。研究于 2009 年 4 月开始招募患者,并于 2010 年 11 月结束”。

解释:作者应明确报告随机化后的脱落和排除,并说明原因。这样就可以评估排除的合理性[41]。此外,还可以计算出样本量减少导致的检验效能损失。
示例中的 RCT 包括一个流程图,其中包含与受试流程和随访脱落有关的特定信息。
CONSORT 条目 14a:招募期和随访时间的长短,并说明具体日期。
示例:“招募患者从 2009 年 4 月开始,到 2010 年 11 月结束”。
解释:报告受试者招募的时间和持续时间提供了历史背景,可能对未来的研究者有价值。在某些试验中,特别是在评估结局发生时间的研究中,并非所有受试者的随访时间都是固定的;相反,随访可以在预先指定的时间点结束,也可能在观察到固定数量的结局事件时结束。
CONSORT 条目 14b:为什么试验中断或停止。
解释:按计划完成的试验结果比过早结束的试验结果更值得信任,特别是在根据数据做出决定的情况下。作者应明确指出试验是否提前结束,包括有关提前终止时间和原因的信息。
示例中的这项研究并未提前终止,并且包含了招募和随访的细节。
1.4.2 基线数据
CONSORT 条目 15:用一张表格列出每一组受试者的基线数据,包括人口学资料和临床特征。
示例:“表中报告了各治疗组患者的基线特征。”(图 2 是报告基线特征表的举例)。
解释:如果随机化已正确进行,则各治疗组的基线特征应相似。收集的所有受试者的基线数据可能包括人口统计学变量(即年龄,性别和种族)和临床特征,包括错位咬合的类型,牙列拥挤的基线测量值和口腔卫生状况。基线数据应在随机分配之前收集,以使数据收集不受对治疗分配的了解的影响。例如,支持较新治疗方法的研究者可能会不自觉地以有偏倚的方式记录基线数据(如增加或减少拥挤的数量),并以某种方式证明对新治疗方法有先入之见。
表格中显示的基线数据可以快速评估各组受试者之间的相似性。组间基线特征的微小差异是随机的,特别是在小型试验中。各组受试者之间基线的重大差异可能与随机分配不当有关。
对于连续变量,例如磨牙间宽度或牙根长度,应包括均值(标准差)或中位数(四分位间距)。不应使用标准差和可信区间来报告变异性,因为它们是推断性的,而不是描述性的。不应将具有少量排序类别的变量视为连续变量;相反,应报告每个类别的数量和比例[1]。不建议进行旨在评估各组之间基线特征平衡的统计测试,这可能会产生误导[42]。明智的做法是,基线比较时应考虑所测变量的预测强度,以及任何随机误差的大小[42]。
1.4.3 纳入分析的例数
CONSORT 条目 16:各组纳入每一种分析的受试者数目(分母),以及是否按最初的分组分析。
示例:“最后 1 例患者入院两年后,用化学固化胶粘剂的 110 个固定器中有 47 个(42.7%)和 110 个固定器中有 55 个(50.0%)失败了。初步分析是在意向性分析的基础上进行的,涉及所有在估算缺失数据后被随机分组的患者。”(图 3 是一个示例表,报告了失效数量和随访时间)。

解释:应明确所有分析中的每组受试者人数。对于二分类变量(即风险比和风险差),也应该报告计算之前的分母或事件发生率。将结果表示为分数有助于读者评估一些随机分配的受试者是否被排除在分析之外。因此,结果不应仅仅作为诸如相对风险之类的简要度量来呈现。
1.4.4 结局和估算
CONSORT 条目 17a:各组每一项主要和次要结局指标的结果,效应估计值及其精确性(如 95% 可信区间)。
示例:“根据估算数据得出的危险比[HR=1.15,95%CI(0.88,1.70),P=0.47]。没有证据表明年龄可能是舌侧固定器失效的重要预测指标[HR=0.96,95%CI(0.93,1.00),P=0.08]。填补数据分析得出两者的 HR 相似;未填补数据假设删除了所有缺失值。在 102 例(64.7%)的失效受试者中,只有 66 例(64.7%)测量了粘着残余指数评分,且复合材料之间没有差异(Fisher精确检验,P=0.16);大多数已确认的失效都发生在釉质黏附层。”(图 4 是一个示例表,报告了来自 Cox 回归的危险比)。

解释:对于主要结局指标,作者应为每组结局指标做总结式报告(如发生或未发生事件的受试者数量,或测量的平均值和标准差),再加上组间的对比,也就是效应大小。对于二分类变量,效应大小可以是相对风险,相对风险降低率,优势比或风险差异。对于维持时间数据,可以用危险比或中位维持时间差来度量。对于连续数据,效果度量通常是平均值的差异。作者应该提供组间对比的可信区间,并作为估计效果的精度(不确定性)的度量。从结果中获得的临床相关性更强、更重要的信息是实际差异或效应大小及其不确定性。P值虽然在统计学上有显著意义,但对提供临床相关性的认识作用有限。报告可信区间将结果的解释从重要或不重要的二分法转移到效应的大小或相关性,以及研究数据给出的合理值范围[1]。对于配对对照设计(如左右侧对照),应提供患者间的相关系数,以指导今后的样本量计算[12]。同样,对于具有整群效应的设计,应提供群组内相关系数或变异系数(k)[13, 43]。
CONSORT 条目 17b:对于二分类结局,建议同时提供相对效应值和绝对效应值。
示例:“最后 1 例患者入院两年后,用化学固化胶粘剂的 110 个固定器中有 47 个(42.7%)和 110 个固定器中有 55 个(50.0%)失败了(风险差异:7.3%,95%CI:5.9%,20.5%)。
解释:对于二分类数据,最好同时提供绝对风险和相对风险,因为孤立地解释二者会产生误导[44]。例如,两风险之差(4%−2%=2%),两风险之比(风险比,4/2=2)。然而,风险之间较大的绝对差异(40%−20%=20%)可能在比率量表中呈现相同的差别(风险比,40/20=2);但是,基于绝对差异(2%vs. 20%)的解释可能会完全不同。相对比例的效应估计(如风险比和优势比)在整个人群中比风险差异(比例差异)更具普遍性,因为后者取决于对照组的基线风险,而基线风险随人群而变化。
示例中的研究在填补缺失数据后,根据 ITT 原则对患者进行了分析。提供了主要比较的估计危险比和绝对风险差异以及相关的 95%可信区间。对于次要结局(粘着残余指数),仅提供了纳入分析的例数和P值,因为只有 66%的失效例数进行了该结局指标的测量。
1.4.5 辅助分析
CONSORT 条目 18:所做的其他分析的结果,包括亚组分析和校正分析,指出哪些是预先设定的分析,哪些是新尝试的分析。
示例:“在 102 例(64.7%)的失效病例中,只有 66 例(64.7%)有可能出现粘着残余指数评分,且复合材料之间没有差异(Fisher 精确检验,P=0.16);大多数已确认的失效都发生在釉质粘附层”。
解释:临床试验的受试者在人口统计学或临床基线特征方面存在差异,可能影响对干预措施的治疗反应。可以进行亚组分析,以确定治疗效果是否因于各组患者的基线特征而异,如相同性别、年龄、社会经济地位、口腔卫生以及与矫正治疗的依从性等。随着统计分析数量的增加,观察到某些假阳性结果(多重性问题)的可能性也会增加[21]。亚组比较结果的报告可能会被人为操控,过分强调阳性结果会产生对治疗效果的错误印象。理想情况下,应该预先指定亚组分析的方法[20]。同样,对基线变量的任何调整最好是预先计划指定的;应当说明这些措施的实施是否是因为观察到了基线的不平衡才增加的。
1.4.6 危害
CONSORT 条目 19:各组出现的所有严重危害或意外效果(具体的指导建议参见“CONSORT for harms”)。
示例:“除了与牙菌斑积聚相关的牙龈炎外,未观察到严重危害”。
解释:在评估支持或不支持某项干预措施有效性的证据时,利益和危害之间的平衡是一个重要的考虑因素。因此,应提供评估的治疗组危害及其发生频率的清晰描述。可提供关于 RCTs 中报告危害的 CONSORT 声明扩展[22];在本案例的试验中,除与牙菌斑积聚有关的牙龈炎外,没有其他危害。
1.5 讨论
1.5.1 局限性
CONSORT 条目 20:试验的局限性,报告潜在偏倚和不精确的原因,以及出现多种分析结果的原因(如果有这种情况的话)
示例:“我们的研究局限性在于不可能对所有患者进行失效性检查,尤其是在研究即将结束时”。
解释:在讨论部分中,应提及试验的局限性,尤其是潜在的偏倚来源,包括测量偏倚和失访偏倚。应当参照报告的可信区间讨论观察到的效应计算的不精确度;应将重点放在临床意义上,而不是在P值和统计学意义上[37,44,45]。
同样,应更多地注意对主要的、预先规定的结局指标的分析;应谨慎解释亚组分析和多次测量后的结果[45,46]。
1.5.2 可推广性
CONSORT 条目 21:试验结果被推广的可能性(外部可靠性,实用性)
示例:“这些结果的普遍性可能受到限制,因为这项研究是由一位在化学固化粘合法和光固化粘合法方面都有经验的临床医生(N.P.)在一个中心进行的。”
解释:只要试验的纳入和排除标准相似,且在一致的生物学反应假设下将试验结果适用于其他环境和人群通常是可行的[15,47]。例如,美国的一项 RCT 评估了仅在成人受试者使用的自酸蚀处理剂或传统酸蚀法粘结的托槽失效,其结果适用于英国成人吗?也许是的。同样的结果适用于青少年吗?成人和青少年之间的依从性差异可能会影响结果;因此,在评估外部效度时应考虑与年龄有关的差异。
外部效度取决于内部效度。因此,如果由于偏倚的方法导致试验结果无效,那么外部效度问题就无从谈起了。外部效度取决于受试者的背景和特征、干预措施和试验结果,因为它们由纳入和排除标准决定。
1.5.3 解释
CONSORT 条目 22:与结果相对应的解释,权衡试验结果的利弊,并且考虑其他相关证据。
示例:“尽管注意到固定器失效率没有显著差异,但记录的失效数量相当可观,在脱胶后的两年内从 43%到 50%不等。这种多数失效的情况与最近的预期相符”。
“我们相对较高的失效率可能与前瞻性设计和相对冗长的随访有关。同样,任何损坏都被记录下来;因此,即使是造成轻微后果的小裂缝(甚至在其它回顾性研究中可能被忽略)也已作为失效记录在该研究中”。
解释:讨论应该把证据作为一个整体来考虑,最好是在系统评价的背景下,而不是仅仅关注当前的试验或选定的研究,也许是那些研究正好证实了本试验结果的研究。
本例示范试验在现有证据的背景下讨论了结果,强调了研究的局限性以及延长随访时间的复杂性,并对结果的可推广性发表了评论,因为这种治疗仅限于 1 名经验丰富的操作者。
1.6 其他信息
1.6.1 注册
CONSORT 条目 23:临床试验注册号和注册机构名称。
示例:“该试验未注册”。
解释:为了最大程度地减少数据的不发表和保留,选择性报道以及重复出版的可能性,国际医学杂志编辑委员会要求试验必须进行注册才能出版。
这一立场导致注册的试验数量急剧增加。在报告试验摘要时,作者应提供试验注册号码和试验注册名称的详细信息[48]。这使读者能够获得有关试验及其结果的更多信息。注册信息还有助于将报告与后续的完整出版物(或同一试验的多个报告)链接起来,从而降低了系统评价中无意识重复计算的风险。
未注册的试验继续在 AJO-DO 中发表;这使得未注册的正在进行的试验有机会被发表。目前,临床试验未注册,其试验结果不会被刊登。关键在于临床试验注册是否透明。但是,这种情况将来可能会改变。因此,强烈建议研究人员从一开始就注册临床试验(例如,通过北美平台 ClinicalTrials.gov 进行注册)[49]。
1.6.2 方案
CONSORT 条目 24:如果有的话,在哪里可以获取完整的试验方案。
示例:“该临床试验方案未在试验开始前发表”。
解释:预发表临床试验方案很重要,因为它提供了试验的所有计划细节。将方案置于公共领域允许对预期和实际完成进行比较,因此不鼓励只对阳性的结果进行选择性报告[20]。方案的发表还向科学界通报了计划中的和正在进行的试验,并为研究人员和系统评价作者提供了更好的交流和更高的效率。SPIRIT 指南详细描述了起草 RCT 研究方案的要求[50]。
理想情况下,应该明确临床试验方案是否可以获得以及在何处可以获得。透明度至关重要;CONSORT 声明专注于准确地报告在研究期间所做的事情,而不是对此进行判断。
1.6.3 资助
CONSORT 条目 25:资助和其他支持(如提供药品)的来源,提供资助者所起的作用。
示例:“没有宣布资助或利益冲突”。
−资助和其他形式的支持应明确声明。研究表明,与其他来源资助的研究相比,由制药业赞助的试验具有使结果偏向赞助者的比率更高[51]。通常,资助来源在摘要的末尾或文章“致谢”部分进行报告。
2 摘要
在本说明性文章的最后一节中,我们将按照 CONSORT 的摘要指南,介绍如何报告随机对照试验的摘要[3]。这些条目已在上文进行了描述;然而,由于矫正摘要通常报道不完整,因此有必要简短描述[6]。
表 2 中列出了摘要中需包含内容的清单。要点如下。
① 清楚阐释试验设计的一个重要原因是要确保在电子数据库中建立适当的索引,以使试验更被容易识别。例如:“双臂平行试验”。
② 清晰描述受试者及试验环境,以便读者评估试验的外部效度(推广性)并确定其对自身环境的适用性。示例:“纳入标准包括下颌前牙没有活动性龋齿,修复或断裂,以及足够的口腔卫生”。
③ 应描述每个试验组和对照组干预措施的基本特征。示例:“在私人矫正诊所接受过矫正治疗的患者被随机分配应用化学固化复合材料或光固化复合材料固定器”。④ 摘要应清楚描述试验中涉及的特定目标或研究假设。示例:“该试验的目的是比较在矫正治疗后用化学固化或光固化粘合剂粘结的舌侧固定器的维持率”。
⑤ 作者应明确说明试验的主要结果以及何时进行评估(如评估结果的时间范围)。例如:主要结局指标是任何类型的第一次舌侧固定器损坏;失效的情况种类(粘着残余指数评分)是次要结局指标。患者分别在 1、3、6 个月和放置固定器后每 6 个月复查一次,直到研究结束。
⑥ 重要的是详细介绍随机序列生成方法,随机化方法和实施的限制,以及从受试者分配到干预组中隐藏分配序列的细节。分配隐藏可以防止研究人员影响受试者分配到干预措施组的选择(即选择偏倚)。示例:“随机分组是对 20 位患者进行随机区组排列完成的,其分配隐藏在顺序编号、不透明的、密封的信封中”。
⑦ 作者应说明受试者,干预措施的实施者(通常是卫生保健提供者)和评估结果的人员(数据收集者和分析人员)是否对分组方案知情。示例:“盲法仅适用于结果评估”。
⑧ 应明确随机分配到每个干预措施组的受试者人数,因为这是试验结果的重要组成部分。该数字规定了样本量,读者可以使用它来评估最终分析中是否包括所有被随机分配的参与者。示例:“220 例患者(中位年龄 16 岁,四分位间距 2 岁,范围 12~47 岁)以 1∶1 的比例随机分配到化学粘合剂组或光固化粘合剂组”。
⑨ 对于主要结局指标,作者应将每组结局指标做总结式报告(如发生或未发生事件的受试者数量,或测量的均数和标准差),再加上组间的对比,也就是效应大小。对于二分类结局,效应大小可以是相对风险,相对风险降低率,优势比或风险差。对于维持时间数据,可以用危险比或中位维持时间差来度量。对于连续数据,效果度量通常是平均值的差异。作者应该提供组间对比的可信区间,并作为估计效果的精度(不确定性)的度量。示例:“在至少两年的随访中,用化学固化胶粘剂的 110 个固定器中的 47 个(42.7%)和 110 个固定器中有 55 个(50.0%)发生了某种类型的失效(对数秩检验,P=0.35)。在意向治疗分析的基础上分析数据,危险比(HR)为 1.15[95%CI(0.88,1.70),P=0.47]。没有证据表明年龄可能是舌侧固定器失效的重要预测指标[HR=0.96,95%CI(0.93,1.00),P=0.08]。在 102 例(64.7%)的失效中,只有 66 例(64.7%)进行了粘着残余指数评分,且复合材料之间没有差异(Fisher 精确检验,P=0.16)”。
⑩ 要做出平衡的决定,读者需要有关干预措施的疗效和安全性的信息。摘要中应提及干预措施的重要危害(或意想不到的)影响。如果没有发生重大不良事件,作者应明确说明。示例:“除了与牙菌斑积聚相关的牙龈炎外,未观察到严重危害”。
⑪ 试验结论应与摘要中报告的结果一致,并应明确说明其临床应用(避免泛化)。在适用的情况下,作者还应注意,将结果用于临床前是否需要进行其他研究。示例:“这项研究的结果表明,没有证据表明应用化学和光固化胶粘剂的下颌舌侧固定器的维持率存在差异。总体失效率为 46.4%;然而,这包括任何类型的失效,可能夸大整体失效率”。
⑫ 尽管不是 CONSORT 声明条目,但应记录试验注册和临床试验方案的详细信息,以及说明资金来源。例如:“该试验未注册”,“在试验开始前未发表该方案”或“未声明资助或利益冲突”。
3 结论
在做出临床决策时,循证牙科方法将现有最佳证据、临床专业知识以及患者的偏好和价值观融合在一起。高质量的随机对照试验是系统评价的基础,应置于循证决策的最前沿。完整透明的试验报告有助于准确评估研究质量和正确解释结果。此外,通过明确的报告,可以更快速地确定适合纳入系统评价的研究、评估初步研究结果以及提取数据。经验表明,医学和牙科领域的 RCTs 报告质量仍然不是最理想的,并且受到未发表、不完整、选择性和误导性的报告的不良影响。CONSORT 指南为这些问题提供了有影响力的重要解决方案,在报告矫正临床试验时应遵循该指南,而且,这一指南还可以指导试验的设计和实施。
参考文献:见原文。