关键词:
数据挖掘
危重症
电子病历
社团检测
诊断识别
摘要:
随着医疗信息系统的广泛应用,利用数据挖掘技术从电子病历数据库中发现潜在的有价值诊疗信息越来越受到关注。危重症医学经过三十多年的迅速发展,已成为最重要的需要多学科协作的临床医学专科之一。我国危重症医学同样面临诸多问题与挑战,只有正确应对这些挑战,才能确保危重症医学持续健康的发展。基于传统统计学和复杂网络的数据挖掘技术在对数据的解读、规律的揭示、科学普适性的探究方面具有显著优势,有助于更好地理解和处理实际问题,是缓解医疗资源分布不均匀和医患供求关系不平衡的可行方案。因此,本文进行了基于数据挖掘的危重症电子病历研究。
本文以实际危重症诊疗需求为背景,采用危重症电子病历数据库MIMIC-IV为研究素材,以传统统计学与复杂网络为主要技术手段,对危重症电子病历进行了数据挖掘,并展开深入研究和分析,具体内容概要如下:
(1)针对危重症医疗资源分布不均匀,医患供求关系不平衡等问题,本文进行了基于传统统计学的危重症电子病历研究。包括:1)基于人口统计学模型的危重症住院需求增长模式:通过建立危重症患者的人口统计学模型,以及对不同疾病住院需求增长情况分析,本文了解了危重症患者人口结构变化及其分布规律,以及不同疾病流行率与住院需求增长情况;2)基于对比分析模型的危重症疾病谱研究:通过建立对比分析模型,对住院患者疾病谱进行深入分析,本文了解了危重症住院疾病谱以及危重症住院疾病谱的变化趋势;3)基于Kaplan–Meier模型的医疗服务指标研究:通过建立Kaplan–Meier模型,探索危重症患者前后期两组数据的住院天数和再入院率是否存在显著性差异。结果表明,医疗体制改革降低了危重症住院患者的再入院率,Logrank=1109.03,p=e-2453.61<003 0.,但增加了住院时间,Logrank=7076.56,p=<0.0050.00。
(2)针对危重症患者并发症的预防和辅助诊断等问题,本文进行了基于复杂网络的危重症电子病历研究。提出了基于RR的危重症并发症网络构建算法,并对危重症并发症网络进行了详细分析,包括:1)稳定性分析:通过计算并发症网络的同配系数与变量梯度分析法,证明了在时间和层级角度上危重症并发症网络构型的稳定性;2)层次结构挖掘:通过划分法和社团检测算法分别进行了网络的层次结构挖掘,发现了并发症网络中的社区结构,进而了解了并发症之间的相互关系,对于提高医生对并发症网络的理解和分析能力,以及预防和治疗并发症具有重要意义;3)相似性与差异性分析:通过对网络的拓扑结构、节点相似性、边相似性三个方面来衡量了男女两性并发症网络的相似性与差异性。结果表明,男女两性危重症并发症网络在总体上是相似性的,但由于男女两性在生理和生物学上的差异导致了他们对怀孕、分娩和产褥期疾病等的易感性不同;4)关键诊断挖掘:本文提出了基于度中心性、特征向量中心性、Page Rank算法的融合算法进行关键诊断挖掘,保证了各算法互补性及其各自优势的同时,提高了诊断识别的稳定性和准确度,避免了单一算法的局限性,有助于了解并发症的传播和扩散机制,并实现精准治疗。同时本文将并发症网络分析结果与现有的医学知识进行比对和解释,验证相关分析的有效性。