关键词:
机器学习分类算法
临床预测模型
新冠肺炎
摘要:
新型冠状病毒自2019年12月以来在全球大面积蔓延,在此期间,我国病死率远低于全球平均水平。该数据表明,我国的新冠防控总策略是科学的、是有效的,做好新冠病毒诊断与患者救治,采取各项措施预防或减少死亡,降低疫情感染率和病死率是重中之重。在新冠病毒的检测筛查方面,X光片和CT均有助于诊断该疾病,其精确度高于核酸检测方法,然而,使用X光片进行新冠肺炎筛查也存在人工筛查工作量大,效率低,误诊率高的问题,准确且高效地诊断X光片是检测筛查的关键;在新冠病毒患者的救治方面,研究表明,一旦新冠肺炎出现短时间大面积的爆发,医疗系统将会在不到四周的时间内崩溃,而当医院容量不堪重负时,死亡率就会急速上升,因此,在新冠肺炎患者确诊时对其死亡风险作出准确预测,对于目前疫情严重地区医疗体系超负荷的医院合理安排氧气瓶与ICU床位等重要资源,从而挽救更多患者的生命至关重要。临床预测模型可以为医疗决策提供更加数据化且更加准确的信息,应用愈发普遍。考虑到机器学习算法在复杂数据的处理上表现突出,在医疗记录、医学影像、生命体征等各类数据的诊断与预后预测中达到了超越人工的准确率,本文结合国内疫情防控流程经验,搭建基于机器学习分类算法的新型冠状病毒临床预测模型,在诊断模型部分,使用CNN算法与Res Net算法对包含新冠肺炎、病毒性肺炎与正常人三分类的新冠肺炎X光图像数据集进行分类预测,测试深度学习算法性能,探究适合新冠肺炎诊断的分类算法作为临床辅助诊断的手段;在预后模型部分,本文首先使用非负矩阵分解方法对患者的年龄、已有疾病、临床检验项目三类共47个指标做降维处理,得到转移酶、血细胞、凝血、病毒感染、合并症、肾功能6个新指标,再结合使用KNN算法、随机森林算法、线性判别分析、朴素贝叶斯分类等多种算法作为分类器,对降维后的数据进行判别分析,评估各个模型性能的差异,探究适合新冠病毒患者死亡风险预测的最优分类算法。实证结果显示,在诊断模型部分使用Res Net18、在预后模型部分使用随机森林时临床预测模型准确率最高。因此,综合考虑模型性能,新冠病毒临床预测模型的最优选择为,首先在患者出现临床症状与体征前往医院就诊时,基于X光图像采用Res Net18算法进行诊断,再对于其中的确诊患者,基于临床检查指标使用随机森林算法进行轻重症的区分,最后根据模型结果分配医疗资源,提供针对性治疗。此外,根据预后模型部分的描述性统计分析与实证研究结果可以看出,年龄、已有疾病及部分临床检测指标均是新冠肺炎患者死亡风险的影响因素,因此结合医院实际情况,应当从针对高龄患者倾注更多医疗资源、全面筛查患者既有疾病、持续监控临床检测关键指标几个方面做好救治工作,降低患者死亡风险。