关键词:
前交通动脉瘤
破裂风险
机器学习
预测模型
摘要:
目的:通过回顾性分析破裂前交通动脉瘤患者与未破裂前交通动脉瘤患者的一般临床资料与动脉瘤形态学特征,利用Logistic回归方法与机器学习方法,得出前交通动脉瘤破裂的独立危险因素,并建立前交通动脉瘤破裂风险预测模型,为临床治疗决策提供帮助与参考。方法:利用青岛大学附属医院临床科研大数据平台,检索出在2012年12月至2021年1月期间就诊于青岛大学附属医院的前交通动脉瘤患者信息。后利用电子病历系统,查询并收集患者的一般临床特征,之后在医院影像系统上测量收集与前交通动脉瘤相关的CTA影像学形态学特征。采用R软件(4.0.4版本)对收集的患者临床特征、形态学特征数据进行处理及分析。对患者的特征数据进行一般资料比较分析,后纳入临床特征及形态学特征为预测因素,分别选用传统的Logistic回归、机器学习中的分类树、随机森林、人工神经网络及集成模型的方法建立前交通动脉瘤破裂预测模型,计算预测模型的准确度、敏感度、特异度等指标,并分别绘制受试者工作特征(ROC)曲线,比较几种预测模型的曲线下面积(AUC)。结果:本研究共回顾性纳入符合标准的前交通动脉瘤患者436例,按入院时动脉瘤破裂与否将纳入研究的患者分为破裂组与未破裂组。前交通动脉瘤破裂引起蛛网膜下腔出血的破裂组患者共263例,未破裂前交通动脉瘤患者173例。其中以下特征两组患者差异无统计学意义:性别占比、吸烟史、高血压病史、动脉瘤朝向、蛛网膜下腔出血病史。而两组患者的年龄、动脉瘤高度、瘤颈宽度、形态不规则、A1优势征差异有统计学差异,且经多因素Logistic回归分析后,亦为前交通动脉瘤破裂的独立危险因素。破裂组患者年龄为57.30±10.18岁,而未破裂组年龄为60.53±9.80岁,破裂组患者较未破裂组更为年轻,P=0.001。破裂组患者动脉瘤的高度为5.74±2.77mm,而未破裂组患者为4.68±2.59mm,破裂组患者动脉瘤高度明显大于未破裂组患者,差异有统计学意义,P<0.001。破裂组患者动脉瘤瘤颈宽度为2.71±1.06mm;未破裂组患者为2.97±1.48mm,破裂组患者动脉瘤瘤颈宽度小于未破裂组,P=0.033。破裂组患者中,动脉瘤形态不规则的患者有150例,占比为57.0%,而未破裂动脉瘤患者中形态不规则的患者有52例,占比为30.1%,破裂组患者中形态不规则患者的比例明显高于未破裂组,P<0.001。破裂组中具有A1优势征的患者176例,占比66.9%,未破裂组中具有A1优势征的患者81例,占比46.8%,破裂组中有更多比例的患者具有A1优势征,P<0.001,差异有统计学意义。将入组患者按照随机抽样方法按7:3比例分为训练集与测试集。在训练集数据中建立预测模型并在测试集中对模型进行验证。应用传统Logistic回归方法建立列线图预测模型并应用于测试集,ROC曲线下面积(AUC)为0.781(95%CI:0.690-0.871),在0.436截断值下,模型的效能最优。在该截断值下,在测试集中预测的准确率为0.782(95%CI:0.699-0.851),敏感性为0.833,特异性为0.711,一致性检验Kappa值为0.549。根据相关研究,选用机器学习中的分类树、随机森林、Xgboost及人工神经网络方法建立预测模型,并应用于测试集。其ROC曲线下面积(AUC)分别为:0.716、0.733、0.774、0.733。经对比,在测试集中,上述机器学习方法所建立预测模型与Logistic回归方法所建立列线图预测模型有类似的效能。后纳入数种底层模型建立集成模型,并同样在测试集中进行验证。以集成模型方法建立的预测模型ROC曲线下面积(AUC)为0.810(95%CI:0.725-0.894),最佳截断值为0.331。在该截断值下,在测试集中预测的准确率为0.774(95%CI:0.690,0.844),敏感性为0.722,特异性为0.846,一致性检验Kappa值为0.550。利用Delong测试方法对比ROC曲线下面积(AUC)。相比于传统Logistic回归方法建立的列线图预测模型,经机器学习方法建立的集成模型的效能更优,差异有统计学意义(P<0.05)。结论:患者的年龄、动脉瘤的高度、瘤颈宽度、A1优势征、动脉瘤形态不规则是前交通动脉瘤破裂的独立危险因素。多因素Logistic回归建立预测模型,并绘制列线图,能较好的对前交通动脉瘤的破裂风险进行预测。应用机器学习中的分类树及人工神经网络方法,能取得与Logistic回归类似的较好模型效能表现。应用机器学习中的集成模型方法,能构建较传统的Logistic回归方法效能更优的预测模型。在面对未破裂的前交通动脉瘤时,本研究可以为治疗决策的制订提供参考,可能具有一定的临床应用价值。