在临床干预试验中,运用随机分配是对照试验中控制偏倚和混杂的最佳工具。研究人员必须确保在试验报告中包含读者所需要的信息,以判断结果的有效性及其意义。事实上,完整的试验报告可让临床医生改进他们的临床实践,以反映当前最佳证据,并改善患者临床终点。制定 CONSORT 声明可协助研究人员、作者、审稿人及编辑了解临床试验报告中所需的必要信息。CONSORT 声明适用于任何干预措施,包括草药产品。当前草药干预措施的对照试验未充分报告 CONSORT 建议的信息条目。我们希望最近制定的 CONSORT 建议条目扩展版能更准确地报告草药干预措施随机对照试验,使其更加完整。我们编写的这份解释性文件除概述了每项建议的理由外,还提供了 CONSORT 条目和相关详细说明,并为每项建议提供了良好报告和经验证据的范例,以帮助作者能更好地运用它们。随着越来越多的证据积累和反馈意见的收集,这些有关草药产品临床试验报告的建议可随时进行修订。
随机对照试验(randomized controlled trials,RCT)为医疗保健干预措施的疗效提供了最佳证据[1]。详细计划和良好执行的随机对照试验,为我们提供了对干预措施治疗效果的最佳评估,以此指导临床决策[2, 3],但一些试验常因方法学不严谨,受到偏倚或混杂因素的影响,导致过高或过低评估了干预措施的治疗效果[4-9]。因此人们一直在努力改进 RCT 的设计和报告质量[1, 6, 10, 11]。
当前的研究表明:补充和替代医学(complementary and alternative medicine,CAM)试验的报告质量较差[12, 13]。Linde 等[12, 14]发现,大多数 CAM 试验并未描述随机序列的产生、适当的分配隐藏方法、脱落和退出的病例数量和理由[12]。Moher 等[9, 13]指出,与儿科相关的补充和替代医学的随机对照试验报告中,报告的内容不足 CONSORT 报告清单条目的 40%,而随着时间的推移,虽然报告内容增加了 24%,但总体而言,这些试验报告中报告的信息内容仍不足报告清单的一半。特别值得指出的是,只有不到 50% 的试验报告了随机序列的产生方法,仅 25% 的试验报告了是否采用了分配隐藏[13]。这些结果表明,大部分补充和替代医学RCT的报告质量较差,导致对内部和外部效度的评估很困难[12, 13]。
Linde 等[12](2001 年)的研究表明,不同类型补充替代疗法研究的报告质量可能会有所不同,其中草药试验比顺势疗法和针刺试验更好,但一些系统评价指出在植物药试验报告中,仍未能为判断内部效度、外部效度和可重复性提供所需的信息[15, 16](Gagnier JJ,2003 年,未发表的数据)。一个针对以英文出版的 206 个草药 RCT 报告质量的研究发现,CONSORT 声明中所建议条目报告内容不到 45%[17]。例如,大约 28% 的试验描述了执行干预措施的人员是否对分组使用了盲法,只有 22% 的试验描述了执行分配序列的方法,而 21% 的报告描述了产生分配序列的方法。此外,不同植物药的临床试验报告质量也各不相同,且从 1980 到 2000 年间,一直在改善中[17]。有研究发现草药临床试验的报告,常不包括草药产品本身的详细信息[15](Gagnier JJ,2003 年,未发表的数据)。
众所周知,草药可能会因所用植物的部位、采集时间、活性成分水平、提取类型(水、酒精、甘油)和服用方法而产生差异。因此即便使用相同的植物种类,不同产品的临床试验结果也可能有很大的差异。由于合并数据可能导致无效的推论,因此有差异的草药产品的两次试验通常会被排除在系统评价之外[14, 15](Gagnier JJ,2003 年,未发表的数据)。显然,读者、编辑和审稿人要求增加植物药 RCT 报告的透明度。现在,对照临床试验的报告规范也已被制订。
CONSORT 声明于 1996 年首次发布,并于 2001 年进行了修订[7, 8]。该声明包括一个清单和流程图,用以指导作者和审稿人有关双组平行设计 RCT 发表时应报告的信息资料[7, 8]。CONSORT 声明已得到了许多行业领先的医学期刊、编辑协会、专业协会和资助机构的认可[9]。自发表以来,CONSORT 声明已制定了不同扩展版[10, 18],最近 CONSORT 已扩展到整群随机试验[18]和评价治疗危害性的试验[10]。此外,一个国际针刺研究工作组提出了一系列建议,用以改善针刺平行试验中干预措施的报告(针刺对照试验报告标准或 STRICTA)[11]。尽管这不是 CONSORT 的正式扩展版,但 MacPherson 等[11]将 STRICTA 描述为对 CONSORT 条目 4 的详细说明,并建议作者在报告针刺试验时将 STRICTA 与 CONSORT 结合使用。
2004 年 6 月,一个由临床试验学家、方法学家、药理学家组成的国际小组在加拿大多伦多进行了共识会议,讨论了草药研究报告的建议[19](表 1 和表 2)。由此产生的指南对当前的 CONSORT 条目如何适用于草药临床试验报告进行了详细阐述,这将有助于编辑和审稿人评估草药试验的内、外部效度和可重复性,从而准确评估草药干预措施的安全性和有效性。

通过阐述扩展条目的细节和理由,此说明文件将有助于研究人员计划、开展和撰写草药 RCT 报告。在本文中,我们讨论了每一条目扩展的理由和科学背景,并提供了良好报告的范例。在可能的情况下,我们也讨论了每个条目扩展的经验证据。应当指出,每个详细的解释说明都是对现有 CONSORT 建议条目的补充,因此所有 CONSORT 原条目都首先在表 1 中列出,而详细的解释说明在表 2 中列出。
1 CONSORT 用于草药干预措施试验的详细说明
我们已详细阐述了 CONSORT 用于草药干预试验的必要说明。在报告草药的 RCT 时,除了这些详细说明中建议的信息外,作者还应考虑是否报告 CONSORT 声明中所阐述的内容。在以下内容中,我们不仅列出了 CONSORT 原始条目(常规)的内容,还列出了专门针对草药干预措施 RCT 的详细说明(条目内容中字体加粗部分)。源自试验报告的摘录包括了 CONSORT 条目建议的信息和已拓展的详细说明。
1.1 标题和摘要
1.1.1 条目 1
受试者如何接受干预措施分配(如“随机分配”、“随机化”或“随机指派”)。标题或摘要或两者应说明草药产品的拉丁学名,所用植物的部位及制剂的类型。
1.1.2 范例
题目:“银杏(Ginko biloba)提取物 Egb 761 在认知功能完善的老年人中进行的一个双盲安慰剂对照的临床试验:神经心理学研究结果”[20]。
摘要:“这是一个随机双盲安慰剂对照的……治疗组接受了含有 300 mg 大蒜粉(Garlic Powder,Kwai)……这相当于每日大约 2.7 g 或大约 1 瓣鲜大蒜”[21]。
1.1.3 说明
CONSORT 条目 1 旨在帮助 RCT 报告在电子数据库中的索引和标识[1]。因此需要使用“随机”、“随机化”或“随机分配”一词。在文章标题和摘要中,有必要附加语言文字说明是草药的临床试验。
循证草药临床实践,需要文献支撑。识别草药的临床试验,要求在文章的标题和摘要中报告草药的拉丁学名、所用植物的部位及制剂类型。这些信息将有助于特定草药产品或制剂的 RCT 索引和标识。一些草药可能有特定的商标或商品名;如果合适,那么这些名称应该与所含植物的拉丁学名一起列出。当试验中使用的草药产品为复方品种时,我们建议在标题中列出产品名称,并在摘要中列出该产品中包含的所有草药品种。这样临床报告文章的标题就不会因为要列出所有单独的草药拉丁学名而太长。
研究表明,由于不同数据库检索词和索引程序的多样性,检索与 CAM 相关的主题具有挑战性[22]。有研究发现,如果 CAM 试验(例如植物药试验)的作者在摘要或标题中不参考标准检索词汇,数据库可能无法为其分配适当的索引词[22, 23]。另外,数据库没有对不同 CAM 干预措施建立足够的索引词及属性描述也是一个问题[24]。在报告草药 RCT 时,在标题和摘要中使用前面建议的说明内容,可能会改善索引和检索情况。
2 介绍
2.1 背景
2.1.1 条目 2
科学背景和基本理由说明,包括关于使用特定草药产品的简要试验理由;如适用,说明所试验的为新适应症或传统适应症。
2.1.2 范例
“银杏叶提取物 Egb 761 是一种复合物,以黄酮醇糖苷(24%)和萜烯内酯(6%)含量为质量标准[1, 2]。已经证实含这两类化合物的 Egb 761 在治疗外周血管和脑血管疾病、年龄相关性脑损伤及缺氧或缺血综合征方面的有益作用[1, 3]。体外进行的电子自旋共振(electron spin resonance,ESR)研究表明,Egb 761 是多种活性氧的有效清除剂,包括超氧化物阴离子根(O2−)和羟基根(HO−)[4]。最近用动物模型进行的体外研究表明,该提取物可能在心肌缺血再灌注损伤中发挥抗自由基作用。在这些研究中[5, 6],在用于灌注离体缺血大鼠心脏的溶媒中加入 200 mg/L 的 Egb 761,可显著改善缺血后舒张功能的恢复,减少室性心律失常和酶渗漏,降低自旋截留氧自由基在冠状动脉流出物中的含量。有趣的是,如在心脏灌注之前给动物口服 Egb 761,也观察到了抗心律失常的作用,但只有高剂量(100 mg/kg,持续 10 天)才能显著降低室性心律失常[5]。除使用 Egb 761 进行这些研究[5, 6]外,许多其他相关动物实验研究也表明,活性氧的还原形式包括 O2−、HO−和过氧化氢(H2O2),参与心肌缺血性灌注后组织损伤的发病机制[7-10, 25]。在进行 CPB(心肺搭桥)手术的患者为治疗对象的双盲研究中,我们对通过手动触诊的体外循环手术患者,评价了 Egb 761 口服治疗对于心脏的保护作用[25],体外试验证实 Egb 761 具有抗氧化特性[4-6]。”
2.1.3 说明
对照临床试验报告的背景部分,部分是为了阐明试验的理由[1],同时提供个别干预措施的特定文献支持。现有草药产品类型存在很大的异质性。同一草药的两种不同制剂可能具有不同的植物化学特性、不同的药代动力学特征等。鉴于不同产品的异质性,就所研究草药产品的科研数据(例如 Egb 761)及其研究理由应清楚地阐明。如果没有可供参考的临床试验数据,基于临床前研究数据(即动物研究、观察性研究、病例报告、已知机制)的推论亦可接受。如果没有关于该研究产品的数据,则应参考与当前试验中所评价产品类似的研究资料。在理想情况下,应该很清楚地说明这些信息,包括对使用的草药产品的先前研究进行系统评价[1, 26]。
另外,如果作者评价的是传统适应症,则应报告对该适应症所依据的理论和相关概念。具有该领域相关知识的读者应该能够确定该适应症的理由。例如,中医药临床试验选择了验证中医诊断(例如肝血不足)而不是西医诊断(例如肝炎)的疾病。如是,那么作者应该清楚地说明为什么选择特定干预措施。例如,在传统中医中,“内关”穴位(EH-6,EH 代表心脏经络)被认为与心脏的功能有关(Chuang,1977)。最近一些研究者(Mah 等,1992;Hsu 等,1989)观察到,针刺内关穴可改善冠心病患者的左心室功能[27]。
此外,其他有助于构建临床试验依据理由的数据(如临床试验、动物试验、观察性研究、病例报告、已知/推测的机制),即使是针对传统适应症,也可在背景部分进行描述。这是基于研究假设能够被清晰阐明的理由,可能来源于科学性的、经验性的、历史性的,或者传统意义上的资料。
3 方法
3.1 受试者
3.1.1 条目 3
受试者的合格标准及收集数据的试验场所设置和地点。如果是评价传统适应症,则应描述如何应用传统理论和概念。例如,受试者的纳入标准应反映传统理论和概念的要求。
3.1.2 范例
“临床试验中有 118 例受试者,随机分为两组:清络通痹颗粒治疗组和雷公藤多甙对照组。在治疗组(n=63)中,男 18 例,女 45 例,年龄 18~65 岁,平均 39.5±16.6 岁,病程 2~22 年,平均 7.5±3.6 年。根据美国风湿性关节炎协会(American Association of Rheumatoid arthritis,ARA)设定的标准对这些患者进行 X 光线分级:I 级 7 例,II 级 30 例和 III 级 26 例。对照组(n=55)中,男 10 例,女 45 例,年龄 18~65 岁,平均 38.3±16.7 岁,病程 1~21 年,平均 6.9±3.1 年。其中,I 级 15 例,II 级 21 例,III 级 19 例。两组病例在性别、年龄、病程和 X 光线分级方面具有可比性(P>0.05)。
诊断标准和中医辨证标准:ARA 的诊断是根据 1987 年修订的 ARA 标准进行的。中医辨证阴虚血热:关节灼痛、局部肿胀或畸形、僵硬;皮肤发红、有热感;低烧;口干;尿黄;舌苔红或暗红色,有瘀斑,皮毛发黄或油腻或稀少,有裂痕;脉细数滑或细数。
该研究包括住院和门诊患者,这些患者被诊断为阴虚血热型类风湿性关节炎[28]。”
临床试验的外部效度和可推广性在一定程度上取决于受试者的合格标准[1]。在草药干预措施试验中,关于合格标准的报告通常很少。一个研究发现,不到 75% 草药干预措施的 RCT 充分报告了受试者的合格标准[17]。因此,通过阅读已发表的临床试验报告,发现其中 1/4 的报告无法判断其可推广性。旨在评价传统适应症的草药临床试验,必须报告受试者的合格标准。
与此相关的,作者可选择排除以前使用过该特定草药产品的受试者。例如曾有报道在试验开始之前使用草药产品会导致副作用增加的情况。在艾菊(Feverfew)[29]对照安慰剂预防偏头痛的试验中,纳入了正在使用艾菊的受试者,导致安慰剂组受试者出现了更多的副作用,这可归因于“艾菊停药后综合征”,即与戒断反应相当。其他试验也有过报道:长期使用艾菊,停止使用后出现系统性症状加重[29]。到目前为止,没有经验证据表明草药的临床对照试验之前使用该草药,对治疗效果的估计存在偏差。尽管如此,仍建议在采用和报告合格受试者标准时,排除最近使用过该草药的受试者。
3.1.3 范例
“排除先前用贯叶连翘(至少 450 mg/d)治疗抑郁症,或上个月因任何理由服用过贯叶连翘的受试者。为减少纳入潜在的治疗无效病例,排除在当前抗抑郁药(盐酸氟西汀 20 mg/d,至少 4 周或同等水平)试验无反应的,或在之前超过 1 个抗抑郁药试验中无反应的受试者[30]。”
草药临床试验报告数据收集的环境和地点至关重要[1]。地点高度概括了可能影响研究可推广性的物理因素(如气候和食物来源)、经济因素、地理因素及社会文化因素等。同样,研究环境可因机构、资源、经验、基准风险和外观等有很大差异[1]。一个研究发现,不到 40% 的草药试验报告充分报告了试验环境和地点[17]。试验结果的外部可推广性部分取决于这些信息的完整性。
3.1.4 条目 4
各组干预措施的详细信息及实际实施的方式和时间。如适用,对于草药干预措施的描述应包括表内以下内容:

任何干预措施需要完整描述的信息类型与待评价的干预措施类型有关。如将外科手术作为干预措施的试验,可能需要完整地描述施行手术的个体[1, 31]。对于草药,则需要上述信息来判断试验用药的关键特性。对试验用药的完整描述将有助于判断其相对于其他产品的功效和安全性。
含有草药成分的商业产品种类繁多[32-34]。此外,这些产品的成分含量有很大的差异[34-40],一些产品通常不会列出标签上注明的各个成分的含量(重量、体积和比例)[41],有的甚至不列出任何成分。即使是相同植物种类的产品(如贯叶连翘)也通常包含不同含量的植物标记物/活性成分。例如,有研究表明以下植物种类的商品,其相应成分的含量不同:贯叶连翘(圣约翰草)[42, 43]、茶花(绿茶)[41]、单叶艾菊(Feverfew)[37-39]、刺五加(西伯利亚人参)、西洋参(美国/加拿大人参)[34]、金印草(白毛茛)[44]和 Paullinia cupana(瓜拉纳)[45]。因此,不同产品之间的药理学特性和体外活性可能会有所不同[33, 46]。此外,一些研究表明,某些植物产品不仅包含不同的有益成分,有益成分含量亦有所不同[47, 48]。因此,草药干预试验的作者有必要完整描述所使用的产品。
3.1.4.1 草药产品名称(4A)
范例:“AG(西洋参)胶囊包含由同一供应商(Chai-Na-Ta Corp.,BC,Canada.)供应的 3 年生/安大略种植、干燥、磨碎的西洋参根(Panax quinqueefolius L.)……这是同样的商品,但批次与原始批次不同[49]。”
草药试验报告应注明拉丁学名和通用名称连同命名者姓名和所属科的名称。在条目 1 中,也建议报告拉丁学名和通用名称。按国际公认的植物命名法[50],植物的科学名必须包括拉丁双名(属和特定的上位词)及权威命名者姓名。例如,属:蒲公英,上位词:铁皮石斛,权威命名者:林奈。因此,全名应为 Taraxicum officinale L.(林奈在这里缩写为L.)。附加命名者确认了最初描述此植物的人。常用名称也应在此处列出(如蒲公英、艾菊、圣约翰草)。单独使用通用名称是不够的,因为不同的草药种类可能具有相同的通用名称。例如,Echinacea 是 Echinacea angustifolia、Echinacea pallida 和 Echinacea purpura 的通用名称。但这些植物具有不同的生化特征[51]。
如有关联,应报告专利产品名称(商标名称,如 Kwai)或提取物名称(如 LI 160)和产品的制造商。这些名称是识别特定草药产品(包括其内容及制造或生产)的快速方法。但仅凭这些名称不足以描述产品信息。
作者还应该报告该产品是否在临床试验的地区获得注册许可及为草药产品颁发许可证的具体监管机构。在不同的司法管辖区,获得许可证的规定各不相同。尽管许可证不能保证产品质量或为读者提供充足的草药产品描述,但它让读者确定特定草药的监管状态和可获得性。
3.1.4.2 草药产品的物理特性(4B)
范例(生草药):“人参胶囊包含 3 年生安大略干燥和研磨的人参根。所有人参和安慰剂胶囊都来自同一批次[52]。”范例(提取物):“……所有患者在 30~60 分钟内输注银杏特殊提取物 Egb 761(批次号:5242)(1 个干瓶的 Egb 761 溶于 500 mL 等渗溶液),每天 1 次。干燥的小瓶中含有 200 mg 的银杏叶干燥提取物(药物萃取比为 50∶1),……3 mL 溶液中的 12 H2O 用作溶剂[53]。”。必须对草药产品的物理特性有完整的描述,包括产品或提取物中所含植物的部位及产品的类型[如生(新鲜或干燥)或提取物]。产品中的植物部位与所含成分的数量和种类有关[54]。此外,产品类型亦应该报告,因为不同的产品形式有不同的类型和成分含量[55]。如果产品是提取物,应报告提取溶剂的种类和浓度(如 80% 酒精,100% 水,90% 甘油)及植物与植物提取物的比例[如植物∶植物提取物(2∶1)]。该比例告诉读者生产特定量的最终提取物需要多少植物原料(按重量或体积)。原料认证的方法(即完成方式和由谁进行认证)描述了如何鉴别原料或植物,并允许读者在一定程度上判断草药产品的原料是否来源于被报告的植物。原料的批号为读者提供有关原料来源的关键信息。
3.1.4.3 剂量方案和定量说明(4C)
范例:“该治疗提供 252 片含有 50 mg 银杏标准化提取物 LI 1370(含有 25% 的黄酮类化合物,3% 的银杏内酯和 5% 的双叶内酯)或安慰剂(均由 Lichtwer 制药提供)。受试者每天服用 3 片药片,持续 12 周。银杏叶提取物及其剂量的选择是根据先前试验的结果,据报道该提取物可有效治疗脑供血不足[56]。”
草药试验的作者应报告剂量方案并提供草药产品的定量说明。试验剂量和疗程的相关信息对于重复试验、确立特定剂量和疗程情况下药物的疗效或副作用及其外部可推广性,都非常重要[1]。试验剂量和疗程的理论依据应该是明确的,因为不清晰的描述会引起对试验方法的质疑,并可能会引发一些伦理问题,如为何要开展这个试验。
应该报告所有草药产品成分的重量或含量,无论是天然的还是按剂量单位形式添加的(即添加的材料,如粘合剂、填充剂、赋形剂;如每粒胶囊含 17% 的麦芽糊精,3% 的二氧化硅),及每个剂量单位形式的活性成分/标记成分的百分比(如每粒胶囊含 0.3% 金丝桃素)。这为读者提供了植物产品成分量化的概述。
3.1.4.4 定性测试(4D)
范例:“不同类型的人参皂苷(Rg1,Re,Rf,Rb,Rc,Rb2 和 Rd),其为人参属中的达玛烷皂苷,由加拿大安大略省渥太华大学理学院生物系的阿纳森使用高效液相色谱(high-performance liquid chromatography,HPLC)法分析,该方法类似于美国植物评议会人参评估项目开发的评估程序[27]。具有反相贝克汉姆超球体 C-18、5 微米十八烷基硅烷的贝克汉姆 HPLC 系统,使用 250×4.6 mm 色谱柱进行分析。用于比较的人参皂苷标准品由两个来源提供。Rg1 和 Re 由伊利诺伊大学的 Fong 博士提供,Rf,Rb1,Rc,Rb2 和 Rd 由 In Somefine Chemical Co.,Somerville NJ 提供[57]。”
临床试验应报告草药产品的化学指纹图谱和使用的方法(机械和化学参考标准)及执行者(使用实验室的名称)。可在描述草药产品关键成分的图表或表格中报告指纹图谱。使用正确的技术进行化学分析对于提供清晰准确的产品成分报告至关重要,并且可提供定性和定量信息[58-60]。Bauer 和 Tittel[61]提供了一些用于药理学、临床和毒理学研究的植物材料表征和标准化的指南。分析团体协会(the Association of Analytical Communities,AOAC)也概述了分析特定草药产品的标准[62]美国植物理事会出版的《美国草药药典》[63]和美国药典[64]。报告可能还会描述凭证样本(即保留样本)是否被保留;如果保留,则描述在何处保存或存放,以便有独立的样本可供验证化学特征。因此,在相关的报告中应包括对所有特殊测试/纯度测试(例如,重金属或其他污染物测试)的完整描述及有害成分的去除(其方式及方法)。所有这些方法都是相关的,因为它们可能会改变草药产品的成分。
标准化一直是文章中的辩论焦点[58]。通常,公司或研究人员经常将植物产品标准化为特定的化学“标记”成分。这些“标记”成分可被视为主要的“活性”成分,或仅用作产品化学特性的指标[58]。尽管商业市场上的产品可能尚未标准化,并且经常不知道“有效”成分,但如果在草药产品的临床试验中进行了标准化,则应进行报告。作者应报告产品标准化的内容(如化学成分)、完成方式(如化学反应过程或活性的生物/功能度量)[66]及每个剂量单位形式中该特定成分的百分比。
3.1.4.5 所用对照/安慰剂类型的理论依据(4E)
范例:“此外,安慰剂由含有玉米粉的相同胶囊组成。安慰剂的能量、碳水化合物含量和外观被设计为与 AG(美国花旗参胶囊)相类似[49]。”
在草药临床试验中,像在其他试验中一样重要的是要完整地描述对照组的特征及其设盲方式[1]。如果使用安慰剂对照,则安慰剂应与对照的干预措施密切匹配[67]。对于草药干预措施试验,应当描述使用该对照/安慰剂类型的理由。有一些试验报告使用安慰剂的颜色和气味与活性干预措施相匹配,但安慰剂包含一定的自身活性成分[68]。如果对照组使用的安慰剂有一定的活性,则它与试验组之间的比较将会造成影响。设计与某些草药产品相匹配的安慰剂,虽然是一种挑战,但并非不可能。
3.1.4.6 对于实施干预措施的研究者的描述(4F)
范例:“为参与研究,医师必须是拥有医学学位的医学专家,获得德国医学针灸学会的中医认证学位,并且至少有 5 年的中医实践经验(根据德国针灸学会工作组标准)。中药组的草药配方由中医师(Carl-Hermann Hempen)设计,并由 1 名药剂师来制备,他们均是中草药专家(S. Dietz,Franz-Joseph Pharmacy,慕尼黑,德国)。除了基本处方外,每位患者还根据“辨证论治”服用第二种附加处方(表 3)[69]。”

有时候,草药干预试验可能包括 1 名实施者作为干预措施的一部分。不同研究人员拥有不同的培训水平、年资、理论偏向及在不同环境中的工作经验。类似于外科手术试验,此类试验应提供对作为干预措施一部分的实施者的描述(例如,培训和实践经验)[1]。
3.2 结果
3.2.1 条目 6
清晰定义主要和次要结局测量指标,及在适用时使用任何方法提高测量质量(如多次观察,评估人员的培训)。终点指标应反映干预措施和受试适应症的考虑,如适用,包含其基础理论和概念。
3.2.2 范例
“在基线和治疗后 30 天随访时评估所有终点措施。主要终点措施是生活质量的变化,该变化通过 12 个简短健康调查(the 12-item short form health survey,SF-12)的“身体和心理组成部分摘要”量表进行衡量。SF-12 被广泛用于测量健康和生活质量,并且与原始 36 个简短健康调查(the 36-item short form health survey,SF-36)的分数显示出较高的一致性[11]。SF-36 在几个中国研究中得到了验证,而对 SF-12 的评估正在进行中[11]。次要结局指标包括对身体机能、记忆力、性功能和“气”……“气”的评估量表包含 17 个指标(由访调员管理的问卷中有 14 个,而身体检查则有 3 个),是通过国际合作由中医药领域具有专业知识的临床研究人员研发的。问卷调查表针对的是中医传统问诊中通常包括的症状,包括呼吸、精力、食欲、胃灼热、出汗、肠蠕动、疼痛、温度、睡眠习惯和性能力。体格检查条目涉及舌苔、舌质和脉搏,该量表是为这个研究开发的,尚未进行验证。14 个问卷条目的得分为 0~4 分,体检项目的得分为 0~3 分。“气”的量表的总得分是每个得分的总和,范围从 0(最佳)到 65(最差)[70]。”
与任何 RCT 一样,主要和次要终点指标应与适应症相关,要充分报告并描述用于提高终点指标质量的任何方法[1, 8]。使用 RCT 评价草药干预措施时,可能出现与西方医学术语和概念不能融合的情况。例如,在上述试验中,据称要评价的特定中草药可提高寿命、生活质量、精力、记忆力、性功能和气。“气”是一种中医概念,大致可理解为生命能量。因此,除了健康和生活质量的衡量标准之外,这些研究人员还采取“气”作为衡量指标,测量该试验过程中生命能量的变化。最终,为了评价传统草药的功能,我们建议终点指标应反映基础理论和概念,并且应反映研究中特定草药干预措施的适应症。
4 结果
4.1 基线数据
4.1.1 条目 15
每组的基线人口统计学和临床特征。包括合并用药或合并用草药产品。
4.1.2 范例
“8 例患者(平均年龄 44.9±4.2 岁)使用了艾菊,9 例患者(平均年龄 51.2±2.3 岁)使用了安慰剂胶囊。在研究前,试验组的受试者每天服用 2.44±0.2 艾菊小叶,持续了 3.38±0.58 年,安慰剂组的受试者每天服用 2.33±0.48 小叶,持续 4.18±0.67 年。因此,两组在每天消耗的艾菊数量或持续时间方面差异无统计学意义。
每组有 1 例患者正在服用结合型雌激素(Premarin);安慰剂组的患者也正在服用匹佐替芬。1 例服用艾菊的患者合并服用了口服避孕药 Orlest 21。每组有 1 例患者服用利尿剂:服用艾菊组的患者同时服用了氯拉西,而服用安慰剂的患者服用了含有转氨环丙胺和三氟哌嗪的产品。此外,安慰剂组中的两个人正在服用维生素制剂,而一个人服用氯哌嗪[71]。”
受试者进入试验后的完整描述使读者和临床医生能够评估试验与特定患者的相关性。作为草药产品试验中基线评估的一部分,作者应明确评估和描述当前使用的任何药物或草药产品。组间药物或草药产品使用的差异,可能会使结果受到这些混杂因素的影响[72]。
5 讨论
5.1 解释
5.1.1 条目 20
对结果的解释,考虑到研究假说、潜在偏倚或不精确的来源及多重分析和结局指标所带来的风险。根据所用产品和剂量方案对结果进行解释。
5.1.2 范例
“尽管 Egb 761 是常规使用 120 mg/天的剂量治疗慢性疾病,但我们选择服用超常规剂量两倍以上的该提取物,仅在手术前 5 天服用以应对由于夹钳松开后过量氧化物的产生。DMSO/AFR 浓度的测量结果表明,Egb 761 处理在再灌注的最初 5 至 10 分钟内显著保护了所有采样部位的血浆抗坏血酸水平(表 3)。血浆 TBArs 浓度的分析表明,Egb 761 治疗还抑制(或大大减弱了)MDA 的释放,表明对自由基诱导的脂质过氧化具有保护作用。这两个发现为 Egb 761 在心脏直视手术中的保护作用基础提供了一些线索。据报道,Egb 761 可保护心肌缺血大鼠抗再灌注引起的抗坏血酸减少[6]。我们没有发现 Egb 761 与 AFR 或 DMSO/AFR 之间有能保持抗坏血酸水平的体外化学相互作用。因此,在发挥其抗氧化作用时,提取物能有效抗衡循环的抗坏血酸(如一旦形成氧自由基,则直接将其淬灭)[73]。”
5.1.3 解释
临床试验报告的讨论部分为读者提供了可确定研究的利弊及该研究与该领域其他研究关系的信息。了解该产品和剂量方案的结果与其他采用相似或不同产品或剂量方案的试验结果之间的关系,使读者能够获得一个背景知识,从中确定所使用的特定干预措施的优缺点。因此,作者应清楚说明可能导致试验发现产品或剂量方案的特定原因。
本文在条目 20 下讨论了这一概念,以强调草药 RCT 报告的作者必须明确地将产品和剂量方案视为研究的潜在优势或劣势。尽管我们已将其与条目 22 下的阐述正式分开,在当前证据的背景下讨论试验结果(条目 22);但我们认为讨论部分这些方面是密切相关的,可一并写进稿件正文。
5.2 可推广性
5.2.1 条目 21
试验结果的可推广性(外部有效性)。如可能,讨论使用的草药产品与自我护理和/或实践中使用的产品之间的关系。
5.2.2 范例
“G115 是标准化的人参提取物,通常与多种其他物质组合成为复方制剂并在市场上出售。Ginsana®,Gericomplex®,Geriatric Pharaton®和 ARM229 是几种已研究的商业标准化人参产品,除 G115 之外还可能包括以下物质中的一部分或全部:维生素、矿物质、微量元素和二甲基氨基乙醇酸氢盐。
对消费者的忠告:如前所述,FDA 将人参归为食品补充剂,因此在保健食品商店中广泛销售。估计有五千六百万美国人使用人参产品[6]。但是,Chong 和 Oberholzer[11]指出质量控制存在问题。事实上,最近的一份报告[12]指出,在 50 种商业化的人参制剂中,有 44 种所含人参皂甙的浓度范围为 1.9%~9.0%,而其中 6 种产品中均未检测到人参皂甙[74]。”
可推广性或外部效度,是研究结果在其他情况中成立的程度[75]。这里的“情况”一词可表示其他个人或人群,或其他类似的干预措施、剂量、用药时间、给药途径及其他初次用药时的设定。鉴于市场上出售的草药产品千差万别,而且它们的质量和含量也各不相同,因此对当前试验中所用产品与消费者和从业者所能获得和/或使用的产品之间的关系进行回顾非常有价值。该信息将使读者能够确定其他同样的产品与试验中的产品是否有类似的可用性。临床试验结果的应用部分取决于干预措施或类似干预措施的可用性。
5.2.3 条目 22
在当前证据的背景下对结果进行一般性解释。将试验结果与其他产品的试验结果进行一般讨论。
5.2.4 范例
“迄今大多数已发表的研究都使用了大蒜粉制剂,类似于本研究中使用的制备方法。这些研究之间结果存在相当大的差异。例如,Adler 等[13]使用商业化的脱水大蒜片,报告称 LDL-C 水平相对于安慰剂组在 12 周内净下降了 13.1%。Jain 等[15]使用相同的产品和类似的设计,报告中度高胆固醇血症成年人的 LDL-C 水平显著净下降 8%。但是,其他三个研究[19, 20, 22]使用相同剂量的相同商品化脱水大蒜粉产品(Lichtwer Pharmaceuticals 的 Kwai®)报告没有明显效果。刚刚引用的 5 个研究中使用的大蒜粉片剂为 900 mg/天,与本研究中使用的 1000 mg/天的总量相似。本研究中使用的片剂中大蒜素含量为总量 1500 mg/天,低于其他大蒜粉制剂研究中的大蒜素含量。降脂试验中使用的其他类型的大蒜制剂包括陈年大蒜提取物和成组的大蒜油。Steiner 等[14]使用大剂量,每天 9 片的老化大蒜提取物,并报告其血浆 LDL-C 水平降低了 4.6%,差异有统计学意义。相比之下,最近一个使用蒸大蒜油补充剂的研究表明,高胆固醇血症成年人在 12 周后对胆固醇水平没有明显影响[18]。一种解释可能是该油不如脱水大蒜粉有效,因为它含有不同的含硫植物化学物质[30]。这些研究中报告的差异可用研究设计、持续时间、受试者特征、依从性或混杂因素(例如体重,饮食和运动)方面存在的异质性来解释[76]。”
将试验结果置于现有经验证据的背景下作相关讨论非常重要[1, 77]。一些试验未能为读者提供足够的信息去确定当前的结果如何与其他研究相关。例如,Drew 和 Davies[56]报告“银杏叶提取物 LI 1370 在治疗耳鸣方面比安慰剂没有更大的治疗作用。此外,其他脑功能不全的症状并未受到治疗的显著影响(表 3)。该试验的结果与某些报告相似,但与其他报告相反,该研究在许多方面与其他试验有所不同”。相对于已评价的其他产品,这为读者提供了很少的信息来判断当前评价产品的功效。不同的植物产品可能具有不同的成分,因此具有不同的治疗效果[34-40]。
建议在植物干预措施试验的讨论部分,结合先前研究的结果讨论其试验结果,同时明确考虑所用产品之间的相似性或差异性。参考已经评价过的其他产品的文献来支持或推翻试验结果是不合适的。作者在不同产品的试验结果间推论时,应非常谨慎小心。如果不存在特定产品相关的临床试验,则应讨论临床前数据,这包括动物、体外和其他数据。
6 评价
在临床干预措施的对照试验中,随机分配是控制偏倚和混杂的最佳工具。研究者必须确保在这些试验的报告中包括读者需要的信息,以判断研究结果的有效性。在某种程度上,完整的临床试验报告将使临床医生能够准确评估研究结果,从而反映当前证据,改变其临床实践。CONSORT 声明旨在帮助研究人员、作者、审稿人和编辑了解临床试验中必要的信息。CONSORT 声明适用于任何干预措施,包括草药产品。
草药干预措施的对照试验未能充分报告 CONSORT 报告规范中建议的报告内容。最近,数个 CONSORT 条目得以详细解释,以便更适用于草药对照试验[19]。我们希望这些建议能够帮助更完整、准确地报告草药试验的内容。
我们编写此说明性文件,是为了进一步详细说明并帮助作者使用。我们会提供 CONSORT 条目和相关的详细说明,并在可用的情况下提供良好报告和经验证据的示例。随着越来越多的证据积累和批评意见的收集,这些有关草药 RCT 报告的建议可随时更改和修订。
参考文献
见原文。
随机对照试验(randomized controlled trials,RCT)为医疗保健干预措施的疗效提供了最佳证据[1]。详细计划和良好执行的随机对照试验,为我们提供了对干预措施治疗效果的最佳评估,以此指导临床决策[2, 3],但一些试验常因方法学不严谨,受到偏倚或混杂因素的影响,导致过高或过低评估了干预措施的治疗效果[4-9]。因此人们一直在努力改进 RCT 的设计和报告质量[1, 6, 10, 11]。
当前的研究表明:补充和替代医学(complementary and alternative medicine,CAM)试验的报告质量较差[12, 13]。Linde 等[12, 14]发现,大多数 CAM 试验并未描述随机序列的产生、适当的分配隐藏方法、脱落和退出的病例数量和理由[12]。Moher 等[9, 13]指出,与儿科相关的补充和替代医学的随机对照试验报告中,报告的内容不足 CONSORT 报告清单条目的 40%,而随着时间的推移,虽然报告内容增加了 24%,但总体而言,这些试验报告中报告的信息内容仍不足报告清单的一半。特别值得指出的是,只有不到 50% 的试验报告了随机序列的产生方法,仅 25% 的试验报告了是否采用了分配隐藏[13]。这些结果表明,大部分补充和替代医学RCT的报告质量较差,导致对内部和外部效度的评估很困难[12, 13]。
Linde 等[12](2001 年)的研究表明,不同类型补充替代疗法研究的报告质量可能会有所不同,其中草药试验比顺势疗法和针刺试验更好,但一些系统评价指出在植物药试验报告中,仍未能为判断内部效度、外部效度和可重复性提供所需的信息[15, 16](Gagnier JJ,2003 年,未发表的数据)。一个针对以英文出版的 206 个草药 RCT 报告质量的研究发现,CONSORT 声明中所建议条目报告内容不到 45%[17]。例如,大约 28% 的试验描述了执行干预措施的人员是否对分组使用了盲法,只有 22% 的试验描述了执行分配序列的方法,而 21% 的报告描述了产生分配序列的方法。此外,不同植物药的临床试验报告质量也各不相同,且从 1980 到 2000 年间,一直在改善中[17]。有研究发现草药临床试验的报告,常不包括草药产品本身的详细信息[15](Gagnier JJ,2003 年,未发表的数据)。
众所周知,草药可能会因所用植物的部位、采集时间、活性成分水平、提取类型(水、酒精、甘油)和服用方法而产生差异。因此即便使用相同的植物种类,不同产品的临床试验结果也可能有很大的差异。由于合并数据可能导致无效的推论,因此有差异的草药产品的两次试验通常会被排除在系统评价之外[14, 15](Gagnier JJ,2003 年,未发表的数据)。显然,读者、编辑和审稿人要求增加植物药 RCT 报告的透明度。现在,对照临床试验的报告规范也已被制订。
CONSORT 声明于 1996 年首次发布,并于 2001 年进行了修订[7, 8]。该声明包括一个清单和流程图,用以指导作者和审稿人有关双组平行设计 RCT 发表时应报告的信息资料[7, 8]。CONSORT 声明已得到了许多行业领先的医学期刊、编辑协会、专业协会和资助机构的认可[9]。自发表以来,CONSORT 声明已制定了不同扩展版[10, 18],最近 CONSORT 已扩展到整群随机试验[18]和评价治疗危害性的试验[10]。此外,一个国际针刺研究工作组提出了一系列建议,用以改善针刺平行试验中干预措施的报告(针刺对照试验报告标准或 STRICTA)[11]。尽管这不是 CONSORT 的正式扩展版,但 MacPherson 等[11]将 STRICTA 描述为对 CONSORT 条目 4 的详细说明,并建议作者在报告针刺试验时将 STRICTA 与 CONSORT 结合使用。
2004 年 6 月,一个由临床试验学家、方法学家、药理学家组成的国际小组在加拿大多伦多进行了共识会议,讨论了草药研究报告的建议[19](表 1 和表 2)。由此产生的指南对当前的 CONSORT 条目如何适用于草药临床试验报告进行了详细阐述,这将有助于编辑和审稿人评估草药试验的内、外部效度和可重复性,从而准确评估草药干预措施的安全性和有效性。

通过阐述扩展条目的细节和理由,此说明文件将有助于研究人员计划、开展和撰写草药 RCT 报告。在本文中,我们讨论了每一条目扩展的理由和科学背景,并提供了良好报告的范例。在可能的情况下,我们也讨论了每个条目扩展的经验证据。应当指出,每个详细的解释说明都是对现有 CONSORT 建议条目的补充,因此所有 CONSORT 原条目都首先在表 1 中列出,而详细的解释说明在表 2 中列出。
1 CONSORT 用于草药干预措施试验的详细说明
我们已详细阐述了 CONSORT 用于草药干预试验的必要说明。在报告草药的 RCT 时,除了这些详细说明中建议的信息外,作者还应考虑是否报告 CONSORT 声明中所阐述的内容。在以下内容中,我们不仅列出了 CONSORT 原始条目(常规)的内容,还列出了专门针对草药干预措施 RCT 的详细说明(条目内容中字体加粗部分)。源自试验报告的摘录包括了 CONSORT 条目建议的信息和已拓展的详细说明。
1.1 标题和摘要
1.1.1 条目 1
受试者如何接受干预措施分配(如“随机分配”、“随机化”或“随机指派”)。标题或摘要或两者应说明草药产品的拉丁学名,所用植物的部位及制剂的类型。
1.1.2 范例
题目:“银杏(Ginko biloba)提取物 Egb 761 在认知功能完善的老年人中进行的一个双盲安慰剂对照的临床试验:神经心理学研究结果”[20]。
摘要:“这是一个随机双盲安慰剂对照的……治疗组接受了含有 300 mg 大蒜粉(Garlic Powder,Kwai)……这相当于每日大约 2.7 g 或大约 1 瓣鲜大蒜”[21]。
1.1.3 说明
CONSORT 条目 1 旨在帮助 RCT 报告在电子数据库中的索引和标识[1]。因此需要使用“随机”、“随机化”或“随机分配”一词。在文章标题和摘要中,有必要附加语言文字说明是草药的临床试验。
循证草药临床实践,需要文献支撑。识别草药的临床试验,要求在文章的标题和摘要中报告草药的拉丁学名、所用植物的部位及制剂类型。这些信息将有助于特定草药产品或制剂的 RCT 索引和标识。一些草药可能有特定的商标或商品名;如果合适,那么这些名称应该与所含植物的拉丁学名一起列出。当试验中使用的草药产品为复方品种时,我们建议在标题中列出产品名称,并在摘要中列出该产品中包含的所有草药品种。这样临床报告文章的标题就不会因为要列出所有单独的草药拉丁学名而太长。
研究表明,由于不同数据库检索词和索引程序的多样性,检索与 CAM 相关的主题具有挑战性[22]。有研究发现,如果 CAM 试验(例如植物药试验)的作者在摘要或标题中不参考标准检索词汇,数据库可能无法为其分配适当的索引词[22, 23]。另外,数据库没有对不同 CAM 干预措施建立足够的索引词及属性描述也是一个问题[24]。在报告草药 RCT 时,在标题和摘要中使用前面建议的说明内容,可能会改善索引和检索情况。
2 介绍
2.1 背景
2.1.1 条目 2
科学背景和基本理由说明,包括关于使用特定草药产品的简要试验理由;如适用,说明所试验的为新适应症或传统适应症。
2.1.2 范例
“银杏叶提取物 Egb 761 是一种复合物,以黄酮醇糖苷(24%)和萜烯内酯(6%)含量为质量标准[1, 2]。已经证实含这两类化合物的 Egb 761 在治疗外周血管和脑血管疾病、年龄相关性脑损伤及缺氧或缺血综合征方面的有益作用[1, 3]。体外进行的电子自旋共振(electron spin resonance,ESR)研究表明,Egb 761 是多种活性氧的有效清除剂,包括超氧化物阴离子根(O2−)和羟基根(HO−)[4]。最近用动物模型进行的体外研究表明,该提取物可能在心肌缺血再灌注损伤中发挥抗自由基作用。在这些研究中[5, 6],在用于灌注离体缺血大鼠心脏的溶媒中加入 200 mg/L 的 Egb 761,可显著改善缺血后舒张功能的恢复,减少室性心律失常和酶渗漏,降低自旋截留氧自由基在冠状动脉流出物中的含量。有趣的是,如在心脏灌注之前给动物口服 Egb 761,也观察到了抗心律失常的作用,但只有高剂量(100 mg/kg,持续 10 天)才能显著降低室性心律失常[5]。除使用 Egb 761 进行这些研究[5, 6]外,许多其他相关动物实验研究也表明,活性氧的还原形式包括 O2−、HO−和过氧化氢(H2O2),参与心肌缺血性灌注后组织损伤的发病机制[7-10, 25]。在进行 CPB(心肺搭桥)手术的患者为治疗对象的双盲研究中,我们对通过手动触诊的体外循环手术患者,评价了 Egb 761 口服治疗对于心脏的保护作用[25],体外试验证实 Egb 761 具有抗氧化特性[4-6]。”
2.1.3 说明
对照临床试验报告的背景部分,部分是为了阐明试验的理由[1],同时提供个别干预措施的特定文献支持。现有草药产品类型存在很大的异质性。同一草药的两种不同制剂可能具有不同的植物化学特性、不同的药代动力学特征等。鉴于不同产品的异质性,就所研究草药产品的科研数据(例如 Egb 761)及其研究理由应清楚地阐明。如果没有可供参考的临床试验数据,基于临床前研究数据(即动物研究、观察性研究、病例报告、已知机制)的推论亦可接受。如果没有关于该研究产品的数据,则应参考与当前试验中所评价产品类似的研究资料。在理想情况下,应该很清楚地说明这些信息,包括对使用的草药产品的先前研究进行系统评价[1, 26]。
另外,如果作者评价的是传统适应症,则应报告对该适应症所依据的理论和相关概念。具有该领域相关知识的读者应该能够确定该适应症的理由。例如,中医药临床试验选择了验证中医诊断(例如肝血不足)而不是西医诊断(例如肝炎)的疾病。如是,那么作者应该清楚地说明为什么选择特定干预措施。例如,在传统中医中,“内关”穴位(EH-6,EH 代表心脏经络)被认为与心脏的功能有关(Chuang,1977)。最近一些研究者(Mah 等,1992;Hsu 等,1989)观察到,针刺内关穴可改善冠心病患者的左心室功能[27]。
此外,其他有助于构建临床试验依据理由的数据(如临床试验、动物试验、观察性研究、病例报告、已知/推测的机制),即使是针对传统适应症,也可在背景部分进行描述。这是基于研究假设能够被清晰阐明的理由,可能来源于科学性的、经验性的、历史性的,或者传统意义上的资料。
3 方法
3.1 受试者
3.1.1 条目 3
受试者的合格标准及收集数据的试验场所设置和地点。如果是评价传统适应症,则应描述如何应用传统理论和概念。例如,受试者的纳入标准应反映传统理论和概念的要求。
3.1.2 范例
“临床试验中有 118 例受试者,随机分为两组:清络通痹颗粒治疗组和雷公藤多甙对照组。在治疗组(n=63)中,男 18 例,女 45 例,年龄 18~65 岁,平均 39.5±16.6 岁,病程 2~22 年,平均 7.5±3.6 年。根据美国风湿性关节炎协会(American Association of Rheumatoid arthritis,ARA)设定的标准对这些患者进行 X 光线分级:I 级 7 例,II 级 30 例和 III 级 26 例。对照组(n=55)中,男 10 例,女 45 例,年龄 18~65 岁,平均 38.3±16.7 岁,病程 1~21 年,平均 6.9±3.1 年。其中,I 级 15 例,II 级 21 例,III 级 19 例。两组病例在性别、年龄、病程和 X 光线分级方面具有可比性(P>0.05)。
诊断标准和中医辨证标准:ARA 的诊断是根据 1987 年修订的 ARA 标准进行的。中医辨证阴虚血热:关节灼痛、局部肿胀或畸形、僵硬;皮肤发红、有热感;低烧;口干;尿黄;舌苔红或暗红色,有瘀斑,皮毛发黄或油腻或稀少,有裂痕;脉细数滑或细数。
该研究包括住院和门诊患者,这些患者被诊断为阴虚血热型类风湿性关节炎[28]。”
临床试验的外部效度和可推广性在一定程度上取决于受试者的合格标准[1]。在草药干预措施试验中,关于合格标准的报告通常很少。一个研究发现,不到 75% 草药干预措施的 RCT 充分报告了受试者的合格标准[17]。因此,通过阅读已发表的临床试验报告,发现其中 1/4 的报告无法判断其可推广性。旨在评价传统适应症的草药临床试验,必须报告受试者的合格标准。
与此相关的,作者可选择排除以前使用过该特定草药产品的受试者。例如曾有报道在试验开始之前使用草药产品会导致副作用增加的情况。在艾菊(Feverfew)[29]对照安慰剂预防偏头痛的试验中,纳入了正在使用艾菊的受试者,导致安慰剂组受试者出现了更多的副作用,这可归因于“艾菊停药后综合征”,即与戒断反应相当。其他试验也有过报道:长期使用艾菊,停止使用后出现系统性症状加重[29]。到目前为止,没有经验证据表明草药的临床对照试验之前使用该草药,对治疗效果的估计存在偏差。尽管如此,仍建议在采用和报告合格受试者标准时,排除最近使用过该草药的受试者。
3.1.3 范例
“排除先前用贯叶连翘(至少 450 mg/d)治疗抑郁症,或上个月因任何理由服用过贯叶连翘的受试者。为减少纳入潜在的治疗无效病例,排除在当前抗抑郁药(盐酸氟西汀 20 mg/d,至少 4 周或同等水平)试验无反应的,或在之前超过 1 个抗抑郁药试验中无反应的受试者[30]。”
草药临床试验报告数据收集的环境和地点至关重要[1]。地点高度概括了可能影响研究可推广性的物理因素(如气候和食物来源)、经济因素、地理因素及社会文化因素等。同样,研究环境可因机构、资源、经验、基准风险和外观等有很大差异[1]。一个研究发现,不到 40% 的草药试验报告充分报告了试验环境和地点[17]。试验结果的外部可推广性部分取决于这些信息的完整性。
3.1.4 条目 4
各组干预措施的详细信息及实际实施的方式和时间。如适用,对于草药干预措施的描述应包括表内以下内容:

任何干预措施需要完整描述的信息类型与待评价的干预措施类型有关。如将外科手术作为干预措施的试验,可能需要完整地描述施行手术的个体[1, 31]。对于草药,则需要上述信息来判断试验用药的关键特性。对试验用药的完整描述将有助于判断其相对于其他产品的功效和安全性。
含有草药成分的商业产品种类繁多[32-34]。此外,这些产品的成分含量有很大的差异[34-40],一些产品通常不会列出标签上注明的各个成分的含量(重量、体积和比例)[41],有的甚至不列出任何成分。即使是相同植物种类的产品(如贯叶连翘)也通常包含不同含量的植物标记物/活性成分。例如,有研究表明以下植物种类的商品,其相应成分的含量不同:贯叶连翘(圣约翰草)[42, 43]、茶花(绿茶)[41]、单叶艾菊(Feverfew)[37-39]、刺五加(西伯利亚人参)、西洋参(美国/加拿大人参)[34]、金印草(白毛茛)[44]和 Paullinia cupana(瓜拉纳)[45]。因此,不同产品之间的药理学特性和体外活性可能会有所不同[33, 46]。此外,一些研究表明,某些植物产品不仅包含不同的有益成分,有益成分含量亦有所不同[47, 48]。因此,草药干预试验的作者有必要完整描述所使用的产品。
3.1.4.1 草药产品名称(4A)
范例:“AG(西洋参)胶囊包含由同一供应商(Chai-Na-Ta Corp.,BC,Canada.)供应的 3 年生/安大略种植、干燥、磨碎的西洋参根(Panax quinqueefolius L.)……这是同样的商品,但批次与原始批次不同[49]。”
草药试验报告应注明拉丁学名和通用名称连同命名者姓名和所属科的名称。在条目 1 中,也建议报告拉丁学名和通用名称。按国际公认的植物命名法[50],植物的科学名必须包括拉丁双名(属和特定的上位词)及权威命名者姓名。例如,属:蒲公英,上位词:铁皮石斛,权威命名者:林奈。因此,全名应为 Taraxicum officinale L.(林奈在这里缩写为L.)。附加命名者确认了最初描述此植物的人。常用名称也应在此处列出(如蒲公英、艾菊、圣约翰草)。单独使用通用名称是不够的,因为不同的草药种类可能具有相同的通用名称。例如,Echinacea 是 Echinacea angustifolia、Echinacea pallida 和 Echinacea purpura 的通用名称。但这些植物具有不同的生化特征[51]。
如有关联,应报告专利产品名称(商标名称,如 Kwai)或提取物名称(如 LI 160)和产品的制造商。这些名称是识别特定草药产品(包括其内容及制造或生产)的快速方法。但仅凭这些名称不足以描述产品信息。
作者还应该报告该产品是否在临床试验的地区获得注册许可及为草药产品颁发许可证的具体监管机构。在不同的司法管辖区,获得许可证的规定各不相同。尽管许可证不能保证产品质量或为读者提供充足的草药产品描述,但它让读者确定特定草药的监管状态和可获得性。
3.1.4.2 草药产品的物理特性(4B)
范例(生草药):“人参胶囊包含 3 年生安大略干燥和研磨的人参根。所有人参和安慰剂胶囊都来自同一批次[52]。”范例(提取物):“……所有患者在 30~60 分钟内输注银杏特殊提取物 Egb 761(批次号:5242)(1 个干瓶的 Egb 761 溶于 500 mL 等渗溶液),每天 1 次。干燥的小瓶中含有 200 mg 的银杏叶干燥提取物(药物萃取比为 50∶1),……3 mL 溶液中的 12 H2O 用作溶剂[53]。”。必须对草药产品的物理特性有完整的描述,包括产品或提取物中所含植物的部位及产品的类型[如生(新鲜或干燥)或提取物]。产品中的植物部位与所含成分的数量和种类有关[54]。此外,产品类型亦应该报告,因为不同的产品形式有不同的类型和成分含量[55]。如果产品是提取物,应报告提取溶剂的种类和浓度(如 80% 酒精,100% 水,90% 甘油)及植物与植物提取物的比例[如植物∶植物提取物(2∶1)]。该比例告诉读者生产特定量的最终提取物需要多少植物原料(按重量或体积)。原料认证的方法(即完成方式和由谁进行认证)描述了如何鉴别原料或植物,并允许读者在一定程度上判断草药产品的原料是否来源于被报告的植物。原料的批号为读者提供有关原料来源的关键信息。
3.1.4.3 剂量方案和定量说明(4C)
范例:“该治疗提供 252 片含有 50 mg 银杏标准化提取物 LI 1370(含有 25% 的黄酮类化合物,3% 的银杏内酯和 5% 的双叶内酯)或安慰剂(均由 Lichtwer 制药提供)。受试者每天服用 3 片药片,持续 12 周。银杏叶提取物及其剂量的选择是根据先前试验的结果,据报道该提取物可有效治疗脑供血不足[56]。”
草药试验的作者应报告剂量方案并提供草药产品的定量说明。试验剂量和疗程的相关信息对于重复试验、确立特定剂量和疗程情况下药物的疗效或副作用及其外部可推广性,都非常重要[1]。试验剂量和疗程的理论依据应该是明确的,因为不清晰的描述会引起对试验方法的质疑,并可能会引发一些伦理问题,如为何要开展这个试验。
应该报告所有草药产品成分的重量或含量,无论是天然的还是按剂量单位形式添加的(即添加的材料,如粘合剂、填充剂、赋形剂;如每粒胶囊含 17% 的麦芽糊精,3% 的二氧化硅),及每个剂量单位形式的活性成分/标记成分的百分比(如每粒胶囊含 0.3% 金丝桃素)。这为读者提供了植物产品成分量化的概述。
3.1.4.4 定性测试(4D)
范例:“不同类型的人参皂苷(Rg1,Re,Rf,Rb,Rc,Rb2 和 Rd),其为人参属中的达玛烷皂苷,由加拿大安大略省渥太华大学理学院生物系的阿纳森使用高效液相色谱(high-performance liquid chromatography,HPLC)法分析,该方法类似于美国植物评议会人参评估项目开发的评估程序[27]。具有反相贝克汉姆超球体 C-18、5 微米十八烷基硅烷的贝克汉姆 HPLC 系统,使用 250×4.6 mm 色谱柱进行分析。用于比较的人参皂苷标准品由两个来源提供。Rg1 和 Re 由伊利诺伊大学的 Fong 博士提供,Rf,Rb1,Rc,Rb2 和 Rd 由 In Somefine Chemical Co.,Somerville NJ 提供[57]。”
临床试验应报告草药产品的化学指纹图谱和使用的方法(机械和化学参考标准)及执行者(使用实验室的名称)。可在描述草药产品关键成分的图表或表格中报告指纹图谱。使用正确的技术进行化学分析对于提供清晰准确的产品成分报告至关重要,并且可提供定性和定量信息[58-60]。Bauer 和 Tittel[61]提供了一些用于药理学、临床和毒理学研究的植物材料表征和标准化的指南。分析团体协会(the Association of Analytical Communities,AOAC)也概述了分析特定草药产品的标准[62]美国植物理事会出版的《美国草药药典》[63]和美国药典[64]。报告可能还会描述凭证样本(即保留样本)是否被保留;如果保留,则描述在何处保存或存放,以便有独立的样本可供验证化学特征。因此,在相关的报告中应包括对所有特殊测试/纯度测试(例如,重金属或其他污染物测试)的完整描述及有害成分的去除(其方式及方法)。所有这些方法都是相关的,因为它们可能会改变草药产品的成分。
标准化一直是文章中的辩论焦点[58]。通常,公司或研究人员经常将植物产品标准化为特定的化学“标记”成分。这些“标记”成分可被视为主要的“活性”成分,或仅用作产品化学特性的指标[58]。尽管商业市场上的产品可能尚未标准化,并且经常不知道“有效”成分,但如果在草药产品的临床试验中进行了标准化,则应进行报告。作者应报告产品标准化的内容(如化学成分)、完成方式(如化学反应过程或活性的生物/功能度量)[66]及每个剂量单位形式中该特定成分的百分比。
3.1.4.5 所用对照/安慰剂类型的理论依据(4E)
范例:“此外,安慰剂由含有玉米粉的相同胶囊组成。安慰剂的能量、碳水化合物含量和外观被设计为与 AG(美国花旗参胶囊)相类似[49]。”
在草药临床试验中,像在其他试验中一样重要的是要完整地描述对照组的特征及其设盲方式[1]。如果使用安慰剂对照,则安慰剂应与对照的干预措施密切匹配[67]。对于草药干预措施试验,应当描述使用该对照/安慰剂类型的理由。有一些试验报告使用安慰剂的颜色和气味与活性干预措施相匹配,但安慰剂包含一定的自身活性成分[68]。如果对照组使用的安慰剂有一定的活性,则它与试验组之间的比较将会造成影响。设计与某些草药产品相匹配的安慰剂,虽然是一种挑战,但并非不可能。
3.1.4.6 对于实施干预措施的研究者的描述(4F)
范例:“为参与研究,医师必须是拥有医学学位的医学专家,获得德国医学针灸学会的中医认证学位,并且至少有 5 年的中医实践经验(根据德国针灸学会工作组标准)。中药组的草药配方由中医师(Carl-Hermann Hempen)设计,并由 1 名药剂师来制备,他们均是中草药专家(S. Dietz,Franz-Joseph Pharmacy,慕尼黑,德国)。除了基本处方外,每位患者还根据“辨证论治”服用第二种附加处方(表 3)[69]。”

有时候,草药干预试验可能包括 1 名实施者作为干预措施的一部分。不同研究人员拥有不同的培训水平、年资、理论偏向及在不同环境中的工作经验。类似于外科手术试验,此类试验应提供对作为干预措施一部分的实施者的描述(例如,培训和实践经验)[1]。
3.2 结果
3.2.1 条目 6
清晰定义主要和次要结局测量指标,及在适用时使用任何方法提高测量质量(如多次观察,评估人员的培训)。终点指标应反映干预措施和受试适应症的考虑,如适用,包含其基础理论和概念。
3.2.2 范例
“在基线和治疗后 30 天随访时评估所有终点措施。主要终点措施是生活质量的变化,该变化通过 12 个简短健康调查(the 12-item short form health survey,SF-12)的“身体和心理组成部分摘要”量表进行衡量。SF-12 被广泛用于测量健康和生活质量,并且与原始 36 个简短健康调查(the 36-item short form health survey,SF-36)的分数显示出较高的一致性[11]。SF-36 在几个中国研究中得到了验证,而对 SF-12 的评估正在进行中[11]。次要结局指标包括对身体机能、记忆力、性功能和“气”……“气”的评估量表包含 17 个指标(由访调员管理的问卷中有 14 个,而身体检查则有 3 个),是通过国际合作由中医药领域具有专业知识的临床研究人员研发的。问卷调查表针对的是中医传统问诊中通常包括的症状,包括呼吸、精力、食欲、胃灼热、出汗、肠蠕动、疼痛、温度、睡眠习惯和性能力。体格检查条目涉及舌苔、舌质和脉搏,该量表是为这个研究开发的,尚未进行验证。14 个问卷条目的得分为 0~4 分,体检项目的得分为 0~3 分。“气”的量表的总得分是每个得分的总和,范围从 0(最佳)到 65(最差)[70]。”
与任何 RCT 一样,主要和次要终点指标应与适应症相关,要充分报告并描述用于提高终点指标质量的任何方法[1, 8]。使用 RCT 评价草药干预措施时,可能出现与西方医学术语和概念不能融合的情况。例如,在上述试验中,据称要评价的特定中草药可提高寿命、生活质量、精力、记忆力、性功能和气。“气”是一种中医概念,大致可理解为生命能量。因此,除了健康和生活质量的衡量标准之外,这些研究人员还采取“气”作为衡量指标,测量该试验过程中生命能量的变化。最终,为了评价传统草药的功能,我们建议终点指标应反映基础理论和概念,并且应反映研究中特定草药干预措施的适应症。
4 结果
4.1 基线数据
4.1.1 条目 15
每组的基线人口统计学和临床特征。包括合并用药或合并用草药产品。
4.1.2 范例
“8 例患者(平均年龄 44.9±4.2 岁)使用了艾菊,9 例患者(平均年龄 51.2±2.3 岁)使用了安慰剂胶囊。在研究前,试验组的受试者每天服用 2.44±0.2 艾菊小叶,持续了 3.38±0.58 年,安慰剂组的受试者每天服用 2.33±0.48 小叶,持续 4.18±0.67 年。因此,两组在每天消耗的艾菊数量或持续时间方面差异无统计学意义。
每组有 1 例患者正在服用结合型雌激素(Premarin);安慰剂组的患者也正在服用匹佐替芬。1 例服用艾菊的患者合并服用了口服避孕药 Orlest 21。每组有 1 例患者服用利尿剂:服用艾菊组的患者同时服用了氯拉西,而服用安慰剂的患者服用了含有转氨环丙胺和三氟哌嗪的产品。此外,安慰剂组中的两个人正在服用维生素制剂,而一个人服用氯哌嗪[71]。”
受试者进入试验后的完整描述使读者和临床医生能够评估试验与特定患者的相关性。作为草药产品试验中基线评估的一部分,作者应明确评估和描述当前使用的任何药物或草药产品。组间药物或草药产品使用的差异,可能会使结果受到这些混杂因素的影响[72]。
5 讨论
5.1 解释
5.1.1 条目 20
对结果的解释,考虑到研究假说、潜在偏倚或不精确的来源及多重分析和结局指标所带来的风险。根据所用产品和剂量方案对结果进行解释。
5.1.2 范例
“尽管 Egb 761 是常规使用 120 mg/天的剂量治疗慢性疾病,但我们选择服用超常规剂量两倍以上的该提取物,仅在手术前 5 天服用以应对由于夹钳松开后过量氧化物的产生。DMSO/AFR 浓度的测量结果表明,Egb 761 处理在再灌注的最初 5 至 10 分钟内显著保护了所有采样部位的血浆抗坏血酸水平(表 3)。血浆 TBArs 浓度的分析表明,Egb 761 治疗还抑制(或大大减弱了)MDA 的释放,表明对自由基诱导的脂质过氧化具有保护作用。这两个发现为 Egb 761 在心脏直视手术中的保护作用基础提供了一些线索。据报道,Egb 761 可保护心肌缺血大鼠抗再灌注引起的抗坏血酸减少[6]。我们没有发现 Egb 761 与 AFR 或 DMSO/AFR 之间有能保持抗坏血酸水平的体外化学相互作用。因此,在发挥其抗氧化作用时,提取物能有效抗衡循环的抗坏血酸(如一旦形成氧自由基,则直接将其淬灭)[73]。”
5.1.3 解释
临床试验报告的讨论部分为读者提供了可确定研究的利弊及该研究与该领域其他研究关系的信息。了解该产品和剂量方案的结果与其他采用相似或不同产品或剂量方案的试验结果之间的关系,使读者能够获得一个背景知识,从中确定所使用的特定干预措施的优缺点。因此,作者应清楚说明可能导致试验发现产品或剂量方案的特定原因。
本文在条目 20 下讨论了这一概念,以强调草药 RCT 报告的作者必须明确地将产品和剂量方案视为研究的潜在优势或劣势。尽管我们已将其与条目 22 下的阐述正式分开,在当前证据的背景下讨论试验结果(条目 22);但我们认为讨论部分这些方面是密切相关的,可一并写进稿件正文。
5.2 可推广性
5.2.1 条目 21
试验结果的可推广性(外部有效性)。如可能,讨论使用的草药产品与自我护理和/或实践中使用的产品之间的关系。
5.2.2 范例
“G115 是标准化的人参提取物,通常与多种其他物质组合成为复方制剂并在市场上出售。Ginsana®,Gericomplex®,Geriatric Pharaton®和 ARM229 是几种已研究的商业标准化人参产品,除 G115 之外还可能包括以下物质中的一部分或全部:维生素、矿物质、微量元素和二甲基氨基乙醇酸氢盐。
对消费者的忠告:如前所述,FDA 将人参归为食品补充剂,因此在保健食品商店中广泛销售。估计有五千六百万美国人使用人参产品[6]。但是,Chong 和 Oberholzer[11]指出质量控制存在问题。事实上,最近的一份报告[12]指出,在 50 种商业化的人参制剂中,有 44 种所含人参皂甙的浓度范围为 1.9%~9.0%,而其中 6 种产品中均未检测到人参皂甙[74]。”
可推广性或外部效度,是研究结果在其他情况中成立的程度[75]。这里的“情况”一词可表示其他个人或人群,或其他类似的干预措施、剂量、用药时间、给药途径及其他初次用药时的设定。鉴于市场上出售的草药产品千差万别,而且它们的质量和含量也各不相同,因此对当前试验中所用产品与消费者和从业者所能获得和/或使用的产品之间的关系进行回顾非常有价值。该信息将使读者能够确定其他同样的产品与试验中的产品是否有类似的可用性。临床试验结果的应用部分取决于干预措施或类似干预措施的可用性。
5.2.3 条目 22
在当前证据的背景下对结果进行一般性解释。将试验结果与其他产品的试验结果进行一般讨论。
5.2.4 范例
“迄今大多数已发表的研究都使用了大蒜粉制剂,类似于本研究中使用的制备方法。这些研究之间结果存在相当大的差异。例如,Adler 等[13]使用商业化的脱水大蒜片,报告称 LDL-C 水平相对于安慰剂组在 12 周内净下降了 13.1%。Jain 等[15]使用相同的产品和类似的设计,报告中度高胆固醇血症成年人的 LDL-C 水平显著净下降 8%。但是,其他三个研究[19, 20, 22]使用相同剂量的相同商品化脱水大蒜粉产品(Lichtwer Pharmaceuticals 的 Kwai®)报告没有明显效果。刚刚引用的 5 个研究中使用的大蒜粉片剂为 900 mg/天,与本研究中使用的 1000 mg/天的总量相似。本研究中使用的片剂中大蒜素含量为总量 1500 mg/天,低于其他大蒜粉制剂研究中的大蒜素含量。降脂试验中使用的其他类型的大蒜制剂包括陈年大蒜提取物和成组的大蒜油。Steiner 等[14]使用大剂量,每天 9 片的老化大蒜提取物,并报告其血浆 LDL-C 水平降低了 4.6%,差异有统计学意义。相比之下,最近一个使用蒸大蒜油补充剂的研究表明,高胆固醇血症成年人在 12 周后对胆固醇水平没有明显影响[18]。一种解释可能是该油不如脱水大蒜粉有效,因为它含有不同的含硫植物化学物质[30]。这些研究中报告的差异可用研究设计、持续时间、受试者特征、依从性或混杂因素(例如体重,饮食和运动)方面存在的异质性来解释[76]。”
将试验结果置于现有经验证据的背景下作相关讨论非常重要[1, 77]。一些试验未能为读者提供足够的信息去确定当前的结果如何与其他研究相关。例如,Drew 和 Davies[56]报告“银杏叶提取物 LI 1370 在治疗耳鸣方面比安慰剂没有更大的治疗作用。此外,其他脑功能不全的症状并未受到治疗的显著影响(表 3)。该试验的结果与某些报告相似,但与其他报告相反,该研究在许多方面与其他试验有所不同”。相对于已评价的其他产品,这为读者提供了很少的信息来判断当前评价产品的功效。不同的植物产品可能具有不同的成分,因此具有不同的治疗效果[34-40]。
建议在植物干预措施试验的讨论部分,结合先前研究的结果讨论其试验结果,同时明确考虑所用产品之间的相似性或差异性。参考已经评价过的其他产品的文献来支持或推翻试验结果是不合适的。作者在不同产品的试验结果间推论时,应非常谨慎小心。如果不存在特定产品相关的临床试验,则应讨论临床前数据,这包括动物、体外和其他数据。
6 评价
在临床干预措施的对照试验中,随机分配是控制偏倚和混杂的最佳工具。研究者必须确保在这些试验的报告中包括读者需要的信息,以判断研究结果的有效性。在某种程度上,完整的临床试验报告将使临床医生能够准确评估研究结果,从而反映当前证据,改变其临床实践。CONSORT 声明旨在帮助研究人员、作者、审稿人和编辑了解临床试验中必要的信息。CONSORT 声明适用于任何干预措施,包括草药产品。
草药干预措施的对照试验未能充分报告 CONSORT 报告规范中建议的报告内容。最近,数个 CONSORT 条目得以详细解释,以便更适用于草药对照试验[19]。我们希望这些建议能够帮助更完整、准确地报告草药试验的内容。
我们编写此说明性文件,是为了进一步详细说明并帮助作者使用。我们会提供 CONSORT 条目和相关的详细说明,并在可用的情况下提供良好报告和经验证据的示例。随着越来越多的证据积累和批评意见的收集,这些有关草药 RCT 报告的建议可随时更改和修订。
参考文献
见原文。