关键词:
计算机视觉
视频插帧
特征匹配
超分辨率修复
疾病分类诊断
摘要:
随着医学影像技术的快速发展,医学影像已成为临床诊断的核心依据。然而,传统的人工分析方法在处理庞大且复杂的影像数据时,效率低、工作量大,难以满足现代医疗对高效、低误差容忍的需求。因此,基于人工智能的医学影像分析与辅助诊断技术成为提升诊断质量与效率的关键。计算机视觉技术在疾病诊断、影像重建和图像配准等智能医疗应用中展现出巨大潜力。然而,医学影像种类繁多,其成像模式、数据分布及应用场景均存在显著差异这种复杂性导致相同的计算机视觉方法在不同医学影像场景下执行相同任务时可能表现出显著差异,往往需要应对特定医学场景下的挑战。因此,解决多场景医学影像分析与辅助诊断的挑战,仍是当前医学影像研究的重点任务。
为应对这些亟待解决的问题与挑战,本论文围绕医学影像分析与辅助诊断课题中的四个关键研究展开,主要研究内容如下:
提出了一种创新的运动聚焦分解视频帧插值技术,克服了现有技术在复杂叠加运动轨迹估计中的局限,尤其是医学视频中常见的目标与背景运动叠加导致的帧插值伪影问题。框架通过新颖的运动分解公式,将目标与背景运动分离,分别进行轨迹预测和插值计算,有效去除了复杂运动的干扰。在静态背景下,该框架仅对运动目标进行插值预测,大幅提高了效率并节约了计算资源。实验验证了该方法在胎儿心脏超声视频及自然视频中的优越性,有效解决了医学视频帧率压缩导致可读性差的问题,表现出广泛的临床应用前景。
提出了一种创新的特征匹配方法,有效解决胃肠内窥镜视频中因组织受到挤压、镜头移动等因素引起的特征严重形变、模糊,导致难以准确匹配特征的问题。通过新颖的桥接策略,将特征变形过程逐步分解,采用二次非线性中间插值帧模型预测形变过渡过程,从而实现精确的特征匹配。此外,为突破传统线性运动假设的局限,首次提出了基于至少六张光流图的双向预测二次非线性运动模型,精确拟合复杂的非线性运动轨迹,显著提高了中间帧的生成质量。该方法还设计了针对不同运动模糊类型的去模糊网络,增强了方法的鲁棒性,并构建了一个大规模的胃肠内窥镜影像数据集,支持多种医学任务。
提出了基于扩散模型的超声医学影像超分辨率修复模型,旨在高效恢复低质量超声影像中的细节,生成高分辨率图像以支持临床诊断。通过将传统的随机噪声扩散过程替换为均值回归驱动的随机微分方程,引导噪声流动至低质量图像,优化去噪过程,进而实现高精度图像修复。此外,研究引入对比学习损失,进一步优化生成结果的一致性,提高超分辨率影像的结构保真度和医学可信度。研究还构建了一个包含胎儿心脏超声影像的大规模数据集,涵盖多种解剖结构与病理状态。
提出了一种医学结构感知的多视图联合辅助诊断端到端框架,专注于胎儿先天性心脏病的异常诊断,突破了现有方法仅关注四腔心切面视图的局限,综合多个切面视图中的病理信息,提升了诊断准确性。通过创新的联合诊断策略,框架能够有效整合不同视图中的潜在病理线索,增强了对模糊超声图像中细微分类线索的识别。研究结合类激活映射技术,精准定位心脏关键结构,并引入额外的解码器进行像素遮挡重构,从而优化编码器的特征提取能力,提升对胎儿心脏结构和细节特征的理解。该方法在高质量内部测试集上取得了94.22%的准确率,在外部验证集上取得了83.67%的准确率,均优于所对比的近年来热门的先进方法。此外,本研究构建了一个面向胎儿心脏筛查的超声影像大规模数据集,并引入外部数据验证。