阐述中医药临床有效性证据库(TCM-CED)的构建与应用,为中医药研究证据链提供支持。构建过程主要包括:专家团队组建、TCM-CED 功能模块设计、证据采集、质量控制等。TCM-CED 应用内容包括:中成药系统评价/Meta 分析(SR/MA)自动生成、中医药优势病种证据报告自动生成、中成药证据指数自动运算、优化中医药研究结局指标、中医药研究方法学和报告质量跟踪、促进中医药证据国际传播等。随着信息技术与人工智能的快速发展,TCM-CED 将实现中医药全方位证据链构建及全过程自动化。
2019 年 10 月 25 日,全国中医药大会召开[1];10 月 26 日,《中共中央 国务院关于促进中医药传承创新发展的意见》(以下简称《意见》)发布。《意见》明确指出,要“综合运用循证医学等方法,加大中成药上市后评价工作力度”、“加快中医药循证医学中心建设,用 3 年左右时间,筛选 50 个中医治疗优势病种和 100 项适宜技术、100 个疗效独特的中药品种,以充分彰显中医药在疾病治疗中的优势”[2]。
循证医学相关的证据评价和转化技术体系已引起医学决策模式的巨大变革,在卫生政策、医疗实践、医疗保险、医药科研、医学教育和新药开发等方面均产生了重大影响。而循证实践的关键在于证据平台支撑。我国循证医学起步发展较晚,平台建设相对滞后。特别是中医药研究领域,缺少专业化、结构化、高效率的证据收集与转化平台,导致证据利用效率低下,不能满足现实需求。因此,亟需建成具有我国自主知识产权并与国际接轨的证据系统,保障中医药证据产出的效率和质量,在临床随机对照试验(randomized controlled trial,RCT)设计优化、核心指标集研究、临床问题发现等方面发挥科学价值,为中医药临床指南和说明书修订以及基药目录、医保目录等筛选提供证据支撑,促进更多高质量中医药临床证据的产出,服务中药产业发展。
天津中医药大学与四川大学华西医院中国循证医学中心、兰州大学等单位开展合作,致力于循证医学方法在中医药循证实践中的应用,开展了系列循证中医药方法创新研究,建成了中医药临床证据数据库系统(evidence database system,EVDS),并产生了阶段性成果[3, 4]。EVDS 包括中医药临床有效性证据库(clinical evidence database of traditional Chinese medicine,TCM-CED)、中药临床安全性证据库、针灸临床证据库和中药临床指南数据库,其中 TCM-CED 已经建设完成并投入运营。本文针对 TCM-CED 构建与应用进行介绍。
1 TCM-CED 搭建
1.1 团队组建
专家团队构成包括中医临床专家、循证医学方法学家、信息技术专家等。专家主要来源于天津中医药大学、四川大学、兰州大学、中国科学院自动化研究所、联想(北京)有限公司等单位。
1.2 功能模块关键技术
采用顶层设计证据库架构并完成大数据平台搭建,实现证据检索、提取、存储、清洗、分析和输出的相关模块开发,并适应智能化技术应用需要。主要涉及到以下模块。
1.2.1 数据模块
包括受试者信息(疾病、样本、人口学信息)、研究模型、干预方法、对照措施、结局指标(临床指标、药理学指标、基因指标、评价时点)和研究数据等。
1.2.2 数据清洗
包括数据集成、数据清洗、数据标化、数据转存与管理等。
1.2.3 分析模块
包括描述性分析、质量分析、Meta 分析、漏斗图分析、证据链分析。
1.2.4 质量模块
包括 Cochrane 偏倚风险评估工具(risk of bias,ROB)、临床试验报告统一标准(consolidated standards of reporting trials,CONSORT)等。
1.2.5 证据报告
输出系统评价、说明书、指南共识、医保/基药等所需证据报告。
1.2.6 证据检索
支持关键词、国际疾病分类第十一版(international classification of diseases-11th revision,ICD-11)、干预措施、研究类型等检索方式。
1.2.7 接口模块
包括大数据清洗平台的接口、人工智能自动提取模块的接口等。
1.2.8 智能终端
支持苹果、安卓等多种类型终端的证据输出。
1.2.9 系统管理
包括系统管理、日志管理、参数管理、字典管理、角色管理、权限管理、密钥管理等平台基础支撑性功能。
1.3 证据采集和入库
1.3.1 证据范畴
目前已收录基本药物目录中成药部分、社保药物目录中成药部分、中药注射剂相关 RCT。随后将逐步收录相关中成药的动物实验、细胞实验、分子实验相关研究,以构成完整证据链。
1.3.2 证据检索与筛选
针对中医药临床研究,主要关注疗效和安全性的 RCT。选择中国生物医学文献服务系统(SinoMed)、中国知网(CNKI)、维普数据(VIP)、万方数据、中国科学引文数据库等中文数据库,PubMed、The Cochrane Library、EMbase、Web of Science、OVID、EBSCOhost、Scopus 等外文数据库和临床试验注册平台作为检索资源(图 1)。检索策略主要基于疾病名称和研究设计进行构建。制定纳入排除标准,依据该标准对检索获得的文献进行筛选,对同一篇文献的筛选由两名评价员独立进行,若有分歧讨论解决,必要时需与第三位评价员讨论协商确定(图 2)。


1.3.3 证据录入
首先对纳入研究进行编码,使每一个研究都有对应编号。提取内容主要包括:临床研究发表相关信息(作者、国家/省份、期刊名称、发表时间、基金资助等)、受试者相关信息(疾病名称、样本量、人口学特征等)、干预/对照措施(名称、剂型、剂量、给药途径、溶媒、基础治疗等)、结局指标及具体数据(临床指标、药理指标、基因指标及评价时点等)和研究设计等相关信息。
1.3.4 证据质量评价
针对 RCT,采用 Cochrane ROB 和 CONSORT 分别进行方法学和报告质量评价;针对非随机对照临床研究,采用非随机干预性临床试验偏倚风险评估工具(the risk of bias in non-randomized studies of interventions,ROBINS-I)和非随机设计研究规范报告(transparent reporting of evaluations with nonrandomized designs,TREND)分别进行方法学和报告质量评价;对于动物实验,采用动物实验风险评估工具(SYRCLE’s risk of bias tool for animal studies,SYRCLE)和动物实验研究报告规范(animal research:reporting in vivo experiments guidelines,ARRIVE)分别进行方法学和报告质量评价。
1.3.5 质量控制
TCM-CED 由天津中医药大学研究人员及相关信息技术专家管理维护。人工录入评价时,先对录入员统一培训和考核,采用 Kappa 值和“双录双核”策略,保障数据提取的准确性和质量评价的一致性。TCM-CED 基于系统评价流程进一步采用机器深度学习、语义识别等技术,以实现数据自动提取、自动分析和自动报告,提高数据更新和转化效率;基于人机结合和核对程序,确保机器学习工作的正确性。
2 TCM-CED 应用
TCM-CED 采用关键词检索、ICD-11 疾病目录检索、结局指标索引检索等功能。检索平台亦设有逻辑运算符(AND、OR 等),可进行高级检索,以提高检索的精确度。检索到相应文献后,可查看结构化的信息。主要有以下功能:
2.1 中成药 SR/MA 自动生成
TCM-CED 收录中成药相关研究并已完成对 RCT 研究的结构化信息提取和质量评价,相关用户(研究人员、研究生等)制作 SR/MA 时可根据需要在平台检索相关信息。TCM-CED 支持 PICO 检索、关键词检索和疾病 ICD-11 检索等,并可视化导出结构化的信息及关键数据。
2.2 中医药优势病种证据报告自动生成
TCM-CED 可自动生成中成药临床证据的可视化报告,参考 Cochrane 系统评价要求,证据报告提供研究基本特征,包括受试者(性别、年龄、病程等)、干预措施(药名、用药频次、剂量、疗程等)、对照措施(药名、用药频次、剂量、疗程等)、结局指标(核心指标、主要指标、次要指标等),结果关键数据(合并效应量/可信区间、异质性等)、方法学(RCT 显示 ROB 评价结果)和报告质量(RCT 显示 CONSORT 评价结果)等信息。TCM-CED 可为国家基本药物目录、社保药物目录等制定提供强有力的支撑。2019 年 10 月于河南郑州召开的第三届中原脑病论坛暨 2019 河南脑病大会上,基于 TCM-CED 数据,循证中医药联盟发布了中医脑病中药临床研究 2018 年度报告[5]。
2.3 中成药证据指数自动生成
中医药证据是否充分不仅取决于研究数量,更与研究质量息息相关。通过结合研究数量、研究质量及专家经验,TCM-CED 从多个维度综合分析并经过专家共识,计算出中成药“证据指数”。证据指数可直观呈现中成药研究的证据强度。2018 年 10 月于天津举办的第十届亚太地区循证医学研讨会上,循证中医药研究联盟基于 TCM-CED 数据库发布了中药注射剂临床有效性证据指数[6]。第三届中原脑病论坛也发布了中风病 2018 年度中成药证据指数排行榜[5]。第十二届健康中国论坛循证中药论坛上,循证中医药联盟发布了冠心病心绞痛、中风和肿瘤三类疾病的中成药临床循证评价证据指数,并遴选出各类疾病排名前十的中成药[7]。
2.4 优化中医药临床研究结局指标
结局指标是临床研究的核心元素,药物的疗效需通过结局指标衡量。TCM-CED 通过系统收集中成药相关研究中的结局指标,全面分析现有结局指标现状,及时发现结局指标存在的问题,为不同临床研究结局指标的选择与报告提供参考及建议。同时,TCM-CED 通过系统的提取已自动形成了每个病种的“指标池”,为相关病种“核心指标集”的构建提供研究基础。
2.5 中医药临床研究方法学和报告质量跟踪
TCM-CED 对所收录的研究进行严格的方法学和报告质量评价,全面呈现中成药相关研究年度质量或相关病种研究质量。并可自动对相关病种研究的质量进行比较分析,以及追踪研究质量随时间的变化趋势及分析相关影响因素。
2.6 促进中医药证据国际传播
中医药在疾病预防、养生保健等方面为促进世界人民健康发挥了积极作用,在当下全球处于由疾病医学向健康医学转变的关键时刻,中医药正受到国际社会的广泛关注。通过 TCM-CED 英文版,国外研究者可轻松快捷获取中医药相关研究结果,促进了中医药研究及证据的国际传播,推动中医药参与“一带一路”建设。
3 中医药证据链构建和及全过程自动化
TCM-CED 将以临床价值和优势为导向,基于核心结局指标,链接临床与基础研究证据,在结局指标水平→疾病水平→干预措施水平,形成从分子水平→细胞水平→动物水平→临床水平的证据链,达到临床有效性和安全性证据充分、作用机理清楚的目标。创新中医药优势品种证据链评价方法,从证据节点、原始研究和系统评价维度,以证据链的重要性、真实性、系统性和稳健性四个维度,建立证据链的质量评价工具(图 3)。构建围绕中医药重大优势病种,不同干预措施、不同核心结局指标动态比较的证据矩阵。

近年来,中医药与人工智能逐步结合,“中医药关键技术装备”已得到国家大力支持[8],“智造中药”十年行动也已经启动[9]。中医药证据的产生与转化也需借助人工智能技术。TCM-CED 研究收录和证据转化应用将逐步实现全过程自动化,证据的产出效率将大大提升。
TCM-CED 已成为专业的中医药数据库,但其目前也存在一定局限性:① 在完全实现智能化之前,人工操作仍是必不可少的,这意味着需要大量的人力投入和时间成本,虽然我们采用了一定措施保证其准确性,但仍不能保证 100% 准确;② 人机结合、智能化数据抽取,属于创新性技术,想要保证证据评价的高准确率目前仍有一定技术难度;③ 中医药研究质量普遍较低,如多数研究无法判断是否真正“随机”,虽然我们进行了筛选评价,但总体证据级别仍较低。我们也在运用过程中不断发现问题并不断完善其功能。
4 小结
总之,运用循证医学、大数据和人工智能技术方法,建成系统化、规范化、智能化中医药优势病种临床循证评价证据库(TCM-CED),可解决中医药疗效评价难的“卡脖子”问题。基于 TCM-CED 在研究设计优化、核心指标集研究基础,临床研究等方面提供支撑,发挥科学价值。TCM-CED 将为全球中医药临床规范应用和科学研究提供公共平台,发挥我国在中医药临床研究领域的引领作用。
2019 年 10 月 25 日,全国中医药大会召开[1];10 月 26 日,《中共中央 国务院关于促进中医药传承创新发展的意见》(以下简称《意见》)发布。《意见》明确指出,要“综合运用循证医学等方法,加大中成药上市后评价工作力度”、“加快中医药循证医学中心建设,用 3 年左右时间,筛选 50 个中医治疗优势病种和 100 项适宜技术、100 个疗效独特的中药品种,以充分彰显中医药在疾病治疗中的优势”[2]。
循证医学相关的证据评价和转化技术体系已引起医学决策模式的巨大变革,在卫生政策、医疗实践、医疗保险、医药科研、医学教育和新药开发等方面均产生了重大影响。而循证实践的关键在于证据平台支撑。我国循证医学起步发展较晚,平台建设相对滞后。特别是中医药研究领域,缺少专业化、结构化、高效率的证据收集与转化平台,导致证据利用效率低下,不能满足现实需求。因此,亟需建成具有我国自主知识产权并与国际接轨的证据系统,保障中医药证据产出的效率和质量,在临床随机对照试验(randomized controlled trial,RCT)设计优化、核心指标集研究、临床问题发现等方面发挥科学价值,为中医药临床指南和说明书修订以及基药目录、医保目录等筛选提供证据支撑,促进更多高质量中医药临床证据的产出,服务中药产业发展。
天津中医药大学与四川大学华西医院中国循证医学中心、兰州大学等单位开展合作,致力于循证医学方法在中医药循证实践中的应用,开展了系列循证中医药方法创新研究,建成了中医药临床证据数据库系统(evidence database system,EVDS),并产生了阶段性成果[3, 4]。EVDS 包括中医药临床有效性证据库(clinical evidence database of traditional Chinese medicine,TCM-CED)、中药临床安全性证据库、针灸临床证据库和中药临床指南数据库,其中 TCM-CED 已经建设完成并投入运营。本文针对 TCM-CED 构建与应用进行介绍。
1 TCM-CED 搭建
1.1 团队组建
专家团队构成包括中医临床专家、循证医学方法学家、信息技术专家等。专家主要来源于天津中医药大学、四川大学、兰州大学、中国科学院自动化研究所、联想(北京)有限公司等单位。
1.2 功能模块关键技术
采用顶层设计证据库架构并完成大数据平台搭建,实现证据检索、提取、存储、清洗、分析和输出的相关模块开发,并适应智能化技术应用需要。主要涉及到以下模块。
1.2.1 数据模块
包括受试者信息(疾病、样本、人口学信息)、研究模型、干预方法、对照措施、结局指标(临床指标、药理学指标、基因指标、评价时点)和研究数据等。
1.2.2 数据清洗
包括数据集成、数据清洗、数据标化、数据转存与管理等。
1.2.3 分析模块
包括描述性分析、质量分析、Meta 分析、漏斗图分析、证据链分析。
1.2.4 质量模块
包括 Cochrane 偏倚风险评估工具(risk of bias,ROB)、临床试验报告统一标准(consolidated standards of reporting trials,CONSORT)等。
1.2.5 证据报告
输出系统评价、说明书、指南共识、医保/基药等所需证据报告。
1.2.6 证据检索
支持关键词、国际疾病分类第十一版(international classification of diseases-11th revision,ICD-11)、干预措施、研究类型等检索方式。
1.2.7 接口模块
包括大数据清洗平台的接口、人工智能自动提取模块的接口等。
1.2.8 智能终端
支持苹果、安卓等多种类型终端的证据输出。
1.2.9 系统管理
包括系统管理、日志管理、参数管理、字典管理、角色管理、权限管理、密钥管理等平台基础支撑性功能。
1.3 证据采集和入库
1.3.1 证据范畴
目前已收录基本药物目录中成药部分、社保药物目录中成药部分、中药注射剂相关 RCT。随后将逐步收录相关中成药的动物实验、细胞实验、分子实验相关研究,以构成完整证据链。
1.3.2 证据检索与筛选
针对中医药临床研究,主要关注疗效和安全性的 RCT。选择中国生物医学文献服务系统(SinoMed)、中国知网(CNKI)、维普数据(VIP)、万方数据、中国科学引文数据库等中文数据库,PubMed、The Cochrane Library、EMbase、Web of Science、OVID、EBSCOhost、Scopus 等外文数据库和临床试验注册平台作为检索资源(图 1)。检索策略主要基于疾病名称和研究设计进行构建。制定纳入排除标准,依据该标准对检索获得的文献进行筛选,对同一篇文献的筛选由两名评价员独立进行,若有分歧讨论解决,必要时需与第三位评价员讨论协商确定(图 2)。


1.3.3 证据录入
首先对纳入研究进行编码,使每一个研究都有对应编号。提取内容主要包括:临床研究发表相关信息(作者、国家/省份、期刊名称、发表时间、基金资助等)、受试者相关信息(疾病名称、样本量、人口学特征等)、干预/对照措施(名称、剂型、剂量、给药途径、溶媒、基础治疗等)、结局指标及具体数据(临床指标、药理指标、基因指标及评价时点等)和研究设计等相关信息。
1.3.4 证据质量评价
针对 RCT,采用 Cochrane ROB 和 CONSORT 分别进行方法学和报告质量评价;针对非随机对照临床研究,采用非随机干预性临床试验偏倚风险评估工具(the risk of bias in non-randomized studies of interventions,ROBINS-I)和非随机设计研究规范报告(transparent reporting of evaluations with nonrandomized designs,TREND)分别进行方法学和报告质量评价;对于动物实验,采用动物实验风险评估工具(SYRCLE’s risk of bias tool for animal studies,SYRCLE)和动物实验研究报告规范(animal research:reporting in vivo experiments guidelines,ARRIVE)分别进行方法学和报告质量评价。
1.3.5 质量控制
TCM-CED 由天津中医药大学研究人员及相关信息技术专家管理维护。人工录入评价时,先对录入员统一培训和考核,采用 Kappa 值和“双录双核”策略,保障数据提取的准确性和质量评价的一致性。TCM-CED 基于系统评价流程进一步采用机器深度学习、语义识别等技术,以实现数据自动提取、自动分析和自动报告,提高数据更新和转化效率;基于人机结合和核对程序,确保机器学习工作的正确性。
2 TCM-CED 应用
TCM-CED 采用关键词检索、ICD-11 疾病目录检索、结局指标索引检索等功能。检索平台亦设有逻辑运算符(AND、OR 等),可进行高级检索,以提高检索的精确度。检索到相应文献后,可查看结构化的信息。主要有以下功能:
2.1 中成药 SR/MA 自动生成
TCM-CED 收录中成药相关研究并已完成对 RCT 研究的结构化信息提取和质量评价,相关用户(研究人员、研究生等)制作 SR/MA 时可根据需要在平台检索相关信息。TCM-CED 支持 PICO 检索、关键词检索和疾病 ICD-11 检索等,并可视化导出结构化的信息及关键数据。
2.2 中医药优势病种证据报告自动生成
TCM-CED 可自动生成中成药临床证据的可视化报告,参考 Cochrane 系统评价要求,证据报告提供研究基本特征,包括受试者(性别、年龄、病程等)、干预措施(药名、用药频次、剂量、疗程等)、对照措施(药名、用药频次、剂量、疗程等)、结局指标(核心指标、主要指标、次要指标等),结果关键数据(合并效应量/可信区间、异质性等)、方法学(RCT 显示 ROB 评价结果)和报告质量(RCT 显示 CONSORT 评价结果)等信息。TCM-CED 可为国家基本药物目录、社保药物目录等制定提供强有力的支撑。2019 年 10 月于河南郑州召开的第三届中原脑病论坛暨 2019 河南脑病大会上,基于 TCM-CED 数据,循证中医药联盟发布了中医脑病中药临床研究 2018 年度报告[5]。
2.3 中成药证据指数自动生成
中医药证据是否充分不仅取决于研究数量,更与研究质量息息相关。通过结合研究数量、研究质量及专家经验,TCM-CED 从多个维度综合分析并经过专家共识,计算出中成药“证据指数”。证据指数可直观呈现中成药研究的证据强度。2018 年 10 月于天津举办的第十届亚太地区循证医学研讨会上,循证中医药研究联盟基于 TCM-CED 数据库发布了中药注射剂临床有效性证据指数[6]。第三届中原脑病论坛也发布了中风病 2018 年度中成药证据指数排行榜[5]。第十二届健康中国论坛循证中药论坛上,循证中医药联盟发布了冠心病心绞痛、中风和肿瘤三类疾病的中成药临床循证评价证据指数,并遴选出各类疾病排名前十的中成药[7]。
2.4 优化中医药临床研究结局指标
结局指标是临床研究的核心元素,药物的疗效需通过结局指标衡量。TCM-CED 通过系统收集中成药相关研究中的结局指标,全面分析现有结局指标现状,及时发现结局指标存在的问题,为不同临床研究结局指标的选择与报告提供参考及建议。同时,TCM-CED 通过系统的提取已自动形成了每个病种的“指标池”,为相关病种“核心指标集”的构建提供研究基础。
2.5 中医药临床研究方法学和报告质量跟踪
TCM-CED 对所收录的研究进行严格的方法学和报告质量评价,全面呈现中成药相关研究年度质量或相关病种研究质量。并可自动对相关病种研究的质量进行比较分析,以及追踪研究质量随时间的变化趋势及分析相关影响因素。
2.6 促进中医药证据国际传播
中医药在疾病预防、养生保健等方面为促进世界人民健康发挥了积极作用,在当下全球处于由疾病医学向健康医学转变的关键时刻,中医药正受到国际社会的广泛关注。通过 TCM-CED 英文版,国外研究者可轻松快捷获取中医药相关研究结果,促进了中医药研究及证据的国际传播,推动中医药参与“一带一路”建设。
3 中医药证据链构建和及全过程自动化
TCM-CED 将以临床价值和优势为导向,基于核心结局指标,链接临床与基础研究证据,在结局指标水平→疾病水平→干预措施水平,形成从分子水平→细胞水平→动物水平→临床水平的证据链,达到临床有效性和安全性证据充分、作用机理清楚的目标。创新中医药优势品种证据链评价方法,从证据节点、原始研究和系统评价维度,以证据链的重要性、真实性、系统性和稳健性四个维度,建立证据链的质量评价工具(图 3)。构建围绕中医药重大优势病种,不同干预措施、不同核心结局指标动态比较的证据矩阵。

近年来,中医药与人工智能逐步结合,“中医药关键技术装备”已得到国家大力支持[8],“智造中药”十年行动也已经启动[9]。中医药证据的产生与转化也需借助人工智能技术。TCM-CED 研究收录和证据转化应用将逐步实现全过程自动化,证据的产出效率将大大提升。
TCM-CED 已成为专业的中医药数据库,但其目前也存在一定局限性:① 在完全实现智能化之前,人工操作仍是必不可少的,这意味着需要大量的人力投入和时间成本,虽然我们采用了一定措施保证其准确性,但仍不能保证 100% 准确;② 人机结合、智能化数据抽取,属于创新性技术,想要保证证据评价的高准确率目前仍有一定技术难度;③ 中医药研究质量普遍较低,如多数研究无法判断是否真正“随机”,虽然我们进行了筛选评价,但总体证据级别仍较低。我们也在运用过程中不断发现问题并不断完善其功能。
4 小结
总之,运用循证医学、大数据和人工智能技术方法,建成系统化、规范化、智能化中医药优势病种临床循证评价证据库(TCM-CED),可解决中医药疗效评价难的“卡脖子”问题。基于 TCM-CED 在研究设计优化、核心指标集研究基础,临床研究等方面提供支撑,发挥科学价值。TCM-CED 将为全球中医药临床规范应用和科学研究提供公共平台,发挥我国在中医药临床研究领域的引领作用。