关键词:
心力衰竭
利尿剂抵抗
LASSO回归
特征选择
机器学习
摘要:
目的 基于LASSO回归等机器学习方法探讨心力衰竭患者(heart failure,HF)医学指标对鉴别利尿剂抵抗(diuretic resistance,DR)状态的诊断价值,构建心力衰竭患者利尿剂抵抗早期识别模型,为医生提供更早的干预时机,缩短患者住院时间。方法 收集天津市胸科医院267例心衰患者作为研究对象,以患者64项医学指标作为自变量,以标准尿量、状态类别作为因变量。根据因变量的不同,采用两种方法构建心衰患者利尿剂抵抗早期识别模型。第一种方法是运用最小绝对值收敛和选择算子算法(least absolute shrinkage and selection operator,LASSO)进行回归拟合,采用十折交叉验证法确定最佳λ值,在测试集上通过预测患者标准尿量划分利尿剂抵抗状态;通过均方根误差(root mean square error,RMSE)、决定系数(coefficient of determination,R2)、分类准确度判断识别效果。第二种方法首先是使用最大相关性最小冗余度算法(max-relevance and min-redundancy,mRMR)选择出与状态类别相关的特征子集;然后利用三种不同的机器学习方法:logistic回归(logistic regression,LR)、随机森林(random forest,RF)和支持向量机(support vector machine, SVM)对患者进行状态分类,通过受试者工作特征曲线(receiver operating characteristic,ROC)下面积(AUC)、准确度、精确度、召回率、F1分数判断识别效果。结果 LASSO回归模型的最佳λ值为0.0161,测试集上均方根误差为0.3489,测试集上的决定系数为0.7200,准确度为91.36%。mRMR+LR、mRMR+RF、mRMR+SVM的AUC值分别为0.94、0.89、0.95,准确度分别为0.86、0.77、0.90,精确度分别为0.87、0.80、0.90,召回率分别为0.86、0.75、0.90,F1分数分别为0.86、0.75、0.90。在验证集上,LASSO回归相比于三种机器学习方法展现出更好的预测性能。结论 LASSO回归模型和mRMR+机器学习方法均能有效识别患者利尿剂抵抗状态。相比mRMR+机器学习方法,LASSO回归模型具有更好的利尿剂抵抗识别效果,能够为医院的早期干预提供更为精确的科学依据。