关键词:
脊柱骨折
机器学习
死亡率
重症监护病房
预测模型
摘要:
目的:关于重症监护病房中脊柱骨折患者的严重性评价标准极少,直至目前,除了我们的成果外,尚未有其他人在预测脊柱骨折患者的院内死亡方面做出相关研究。因此,我们当前研究的目的旨在利用患者入院24小时内的各项临床指标评估患者的严重性,做出患者院内死亡风险概率的预测,从而尽早的识别高危患者,指导临床实践。方法:我们的患者来源于两个大型的重症医学数据库,分别是MIMIC-III(Medical Information Mart for Intensive Care version III)数据库和e RI(e ICU Research Institute Database)数据库。我们通过疾病诊断代码来识别诊断为脊柱骨折的患者,并删除重复的入院记录。本研究采集了患者人口学特征、实验室检查、共患病和各项评分系统这四大方面的数据。通过对比死亡组和存活组之间各项指标的统计学差异,以及正则化方法进行降维,最后通过临床经验筛选出有意义的临床特征进行建模。我们使用MIMIC-III数据库作为训练集(内部验证集),使用e RI数据库作为验证集(外部验证集),我们开发并验证了六种流行的机器学习算法,分别是:k邻近算法,随机森林,极限梯度提升,逻辑回归和神经网络。根据模型的内部和外部验证结果,我们进行了数据可视化,并筛选出最佳的模型。考虑到医疗行业的特殊性,我们还进行了模型可解释性分析。结果:最后一共1512名患者纳入本研究中,其中MIMIC数据集纳入1190名患者,117名患者发生院内死亡,死亡率9.83%;e RI数据集中纳入322名患者,25名患者死亡,死亡率7.76%。经过上述方法的筛选,最后我们一共纳入20个临床变量进入模型训练中。模型验证的结果表明,综合来看,无论是内部验证还是外部验证,随机森林算法的表现较为稳定且优秀,其内部验证和外部验证的AUC值分别是0.77和0.73。在可解释性分析中,该模型最重要的三个变量是:体温、平均动脉压和年龄,其他的可解释性分析也证明该模型的判断方式与我们以往的医疗知识一致。结论:我们的研究成功的开发并验证了多个机器学习模型用于预测重症监护病房中脊柱骨折患者的院内死亡,其中随机森林模型的表现最好,模型的可解释性分析也符合医学认知,同时外部验证也证实我们当前的模型具有强大的迁移和泛化能力。综上所述,我们的模型可以早期精确的识别高危患者,提前采取积极有效的有望降低入院患者的死亡率;同时我们的研究也存在一些局限性,特别是本研究是一项回顾性研究,之后需要更多的前瞻性研究对我们的结果进行验证。