关键词:
医学影像分割与分类
深度学习
有限标注
领域知识
半监督学习
协同学习
校正学习
摘要:
我国医疗资源的现状是总量不足、分布不均、增长速度不及需求的增长,为了解决群众“看病难”和“看病贵”的问题,必须发挥科技创新的引领支撑作用,借助人工智能技术,实现并推广包括疾病筛查、诊断、病灶勾勒等影像分析在内的智能诊疗新模式和新手段。近年来,以深度学习为代表的人工智能技术已经在计算机视觉领域取得了很多突破性进展,甚至在一些问题上超越了人类的认知水平。但是,将深度学习应用于医学影像分析时,却往往难以取得类似的优异性能。主要原因在于,深度学习是一种数据驱动的学习范式,需要海量有标注的数据才能有效训练模型;然而,由于医学影像采集成本高、数据隐私性强、对标注者的专业水平要求高等限制因素,医学影像分析研究中所使用的数据集往往都比较小,有标注的训练数据更为有限。标注数据不足的问题,已经成为阻碍医学影像智能分析技术进步和服务临床的一个瓶颈。突破这一瓶颈,不仅可以丰富深度学习的理论和实践,也将为医学影像智能分析技术落地,改善基层医疗条件,实现分级诊疗和普惠医疗提供坚实的理论和技术支撑。
本文针对这一挑战,聚焦于医学影像分割和分类这两个医学影像分析中最重要也最困难的问题,从如何将与影像诊断相关的领域知识融合深度学习,如何利用廉价的无标注/弱标注影像数据辅助模型训练,如何构建有效的纠错机制提高分割模型性能这三个方面展开研究,取得了多项重要研究成果,具体如下:
(1)针对医学影像分类问题,提出了一种基于领域知识的多视图深度协同学习模型。本文以肺结节良恶性诊断为应用场景,基于肺结节恶性度与其在形状和纹理上的异质性高度相关这一领域知识,构造了一个端到端训练的深度学习模型,其中包含分别学习图像整体信息、形状信息和纹理信息的子模块。实验结果表明,该模型可以获得很高的诊断正确率,而且学习形状信息和纹理信息的子模块确实有助于模型性能的提升,从而验证了临床实践探索和发展出的影像诊断知识可以在一定程度上弥补深度学习模型在训练数据较少时难以学到有效表征这一固有缺陷。
(2)针对医学影像分类问题,提出了一种基于非参数共享策略的半监督深度学习模型。为了缓解标注数据少带来的挑战,本文引入一个使用无标注数据进行图像自重建的任务来辅助模型训练。但是,无监督的自重建过程需要学习图像的全部信息,而有监督的分类过程必须过滤与分类无关的背景信息,为了减小这两个任务之间的语义鸿沟,本文设计了一种非参数共享策略,通过构建和使用过渡层,将无监督学习的特征与有监督学习特征进行融合。实验结果表明,该模型可以使用无标注数据提高肺结节良恶性诊断和皮肤癌诊断的正确率。
(3)针对医学影像分割问题,提出了一种基于一对图像间存在语义一致性的半监督深度学习模型。与自然图像的丰富多彩不同,医学影像中往往存在类似的解剖结构和相近的病灶形态;因此,不同影像(无论有无标注)中具有相同语义标签的区域在特征空间中也具有一致的语义表征。本文通过构建影像对内部的像素级语义一致性和影像对之间的注意力一致性,实现有标注数据和无标注数据混合训练的半监督学习框架。在结直肠癌腺体分割任务上,大量实验结果展示了该半监督深度学习模型的性能优势,同时也验证了样本对语义一致性策略的有效性。
(4)针对医学影像分类和分割问题,提出了一种多任务协同深度学习模型。该模型充分利用了医学影像分割和分类这两个任务之间的耦合性,首先利用分割网络为分类网络提供病灶的粗定位,从而提升分类性能;接着,将分类网络学习到的注意力热图迁移到分割网络,提供与诊断相关的位置和语义信息,进一步提升分割性能。在皮肤病变数据集上的实验结果显示,该模型可以同时实现更准确的皮肤病诊断和更准确的病灶分割。
(5)针对医学影像分割问题,引入误差预测和两阶段纠错策略,提出了一种基于“分割-校正-再分割-验证”的深度学习模型。该模型可以兼容不同的分割网络,首先使用任意一个分割网络生成初始分割结果,然后预测分割误差,考虑到预测难以做到完全正确,仅以预测到的误差作为潜在可能出错的区域分布图,连同原图和初始分割结果一起输入分割网络进行再分割,最后使用验证网络基于区域级别确定是接受初始分割结果,还是再分割的结果。在腺体分割任务、皮肤病变分割任务和视网膜血管微动脉瘤分割任务上的大量实验结果验证了误差预测和两阶段纠错策略的有效性,表明该模型可以显著的提升现有分割网络的准确性。