• 1. 四川大学华西医院国家药物临床试验机构(成都 610041);
  • 2. 四川大学华西第二医院(成都 610041);
  • 3. 成飞医院(成都 610041);
导出 下载 收藏 扫码 引用

目的 探讨神经网络(neural networks,NN)在倾向分数值估计中的应用价值,并与基于 logistic 回归(logistic regressive,LR)的倾向分数方法进行比较,检验其统计性能。方法 采用 SAS 9.2 软件,生成包含 10 个定性/定量协变量、1 个结局变量(定量)、1 个分组变量(二分类)的数据集,模拟当 5 种处理因素与协变量存在非线性关系和交互作用的情形,设定样本量分别为 500、1 000、2 000、5 000、10 000。分别采用 LR 和 NN 估计倾向分数值,纳入部分协变量(与处理因素和结局变量同时有关及只与结局变量有关,即 LR1 或 NN1),纳入全部协变量(同时有关、只与结局有关、只与处理因素有关,即 LR2 或 NN2)。比较不同模型中平均处理效应(average treatment effect,ATE)估计值的标准误、偏倚、均方误差。结果 基于 NN 的倾向分数法估计 ATE 的 95% 可信区间较 LR 更窄。随着处理因素与协变量关系复杂程度的增加,ATE 的标准差、偏倚、均方误差逐渐增加,LR1 与 NN1 的 ATE 的标准差、偏倚、均方误差小于 LR2 与 NN2。当只采用与结局变量有关的协变量估计倾向分数时,NN 通常较 LR 产生的 ATE 估计值的偏倚更小。随着样本量的增加,两种方法计算的 ATE 估计值的标准差和均方误差逐渐减少。结论 当处理因素与协变量之间存在潜在复杂关系时,基于 NN 估计的倾向分数法可能会产生更小的偏倚和更精确的 ATE。