关键词:
卒中
吞咽障碍
预测
Logistic模型
算法
机器学习
摘要:
目的 基于老年脑卒中患者临床及实验室指标,利用可解释机器学习方法构建并验证卒中后吞咽障碍(post-stroke dysphagia, PSD)风险预测模型。方法 回顾性选取2010年10月至2021年12月解放军总医院第一医学中心神经内科收治的含有完整吞咽功能表述的老年脑卒中患者3994例,将2019年1月至2021年12月的1390例患者作为外部验证集,2010年10月至2019年1月的2604例作为训练组。将训练组按照7:3随机分为训练集1823例和内部验证集781例,根据是否发生PSD将训练组患者分为PSD组773例和非PSD组1831例。以PSD发生为终点事件,构建随机森林(random forest, RF)、极端梯度提升(eXtreme Gradient Boosting, XGBoost)、支持向量机(Support Vector Machine, SVM)和logistic回归模型,通过ROC曲线评估模型性能。优选最佳模型后,采用夏普利加性解释(SHapley Additive exPlanations, SHAP)方法量化特征。结果 PSD组肌力等级、脑卒中侧、脑损伤区域与非PSD组比较,差异有统计学意义(P<0.01),PSD组高血压、糖尿病、饮酒史、中性粒细胞水平明显高于非PSD组,血钾、血清白蛋白水平明显低于非PSD组(P<0.05,P<0.01)。多因素logistic回归分析显示,年龄、饮酒史、糖尿病、高血压、肌力等级、脑损伤区域、脑卒中侧、中性粒细胞、血清白蛋白、血钾是PSD的危险因素(P<0.05,P<0.01)。在外部验证中,RF、XGBoost、SVM、logistic回归模型验证集的曲线下面积分别为0.883、0.902、0.877、0.868。SHAP值分布显示,饮酒史、高血压、糖尿病与PSD风险呈正相关;肌力等级与风险呈负相关;年龄增长与PSD风险呈正相关;幕下损伤比幕上或全区域损伤的预测作用更强;双侧和右侧损伤较左侧损伤的PSD风险更高。结论 基于XGBoost模型构建的老年患者PSD风险预测模型性能最优。