关键词:
条件扩散模型
三维CT医学影像
不确定性感知
半监督学习
图像分割
摘要:
三维CT医学影像相比二维影像能够更全面地展现人体解剖结构的空间关系。尤其是在肺部疾病诊断、肿瘤定位等方面,计算机辅助的三维CT医学影像分割有助于医生更全面、准确地评估病变。近年来,尽管基于深度学习的三维CT医学影像分割方法已经取得了巨大进展,但是仍存在以下问题限制着其进一步发展:(1)由于患者隐私问题以及疾病的特点,存在数据稀缺以及类别不平衡的问题。(2)三维CT医学影像存在标注成本高、难度大、耗时长等问题。(3)大部分现有的三维分割网络由于局部与全局上下文信息捕获不足而影响分割精度。针对以上问题,本文提出了一种面向数据稀缺的三维CT医学影像生成与分割方法。本文的主要创新点和贡献如下:
第一,为了解决数据稀缺与样本不均衡的问题,针对传统生成模型生成效率低、条件控制不精细的不足,微调了一种潜在空间条件扩散模型MAISI-L生成肺部肿瘤CT影像,通过潜在表示编解码器将高维三维CT医学影像转化为低维潜在表示以降低计算复杂度,在扩散过程中引入肺部解剖结构先验知识作为条件约束,保证了生成图像的解剖学一致性,构建了一个新的肺部肿瘤CT合成数据集。实验结果表明,本文方法所生成的影像与真实影像在特征空间中的分布差异较小,验证了该方法生成三维CT医学影像的优势。
第二,为了解决标注稀缺的问题,针对传统半监督方法无法平衡各种方法的优势有效挖掘未标注数据的不足,构建了一个结合不确定性感知机制的均值教师半监督分割模型UMT-LT,充分利用未标注合成数据与少量带标注真实数据的特征,计算每个体素在添加随机扰动下的预测不确定性,筛选出可信度高的预测区域作为伪标签,通过动态评估伪标签的可靠性来指导模型训练,最终得到可靠伪标签。通过与传统全监督方法及半监督方法的对比实验验证了该方法在数据稀缺场景下获得标签的有效性。
第三,为了解决数据稀缺问题下模型训练的问题,针对传统3D分割方法无法很好融合全局与局部信息的不足,从模型结构和数据两个角度进行研究,通过引入空间注意力机制与多尺度特征融合模块改进3D U-Net架构,提出3D SAMF-Net,对比传统方法有效提升了模型分割的精确度,同时验证了使用合成数据训练模型对模型分割效果的提升,实现了生成图像与真实图像的统一分割。
综上所述,本研究通过生成、半监督学习与分割模型的集成,提出了一个完整的生成式学习联合分割框架,实现了从数据生成、半监督学习到精准分割的全流程集成,为解决三维CT医学影像分割中的数据与标签稀缺问题提供了新的思路,为分割模型训练提供了高质量合成数据,在具体的肺部肿瘤分割任务中提升了分割准确率,所提出的方法具有重要的理论价值和实际应用前景。