关键词:
多分布目标分割
小目标分割
多尺度特征学习
移位通道注意力
摘要:
医学影像是疾病筛查、诊断和治疗的最主要的信息来源。使用计算机辅助诊断技术对医学影像信息进行进一步的智能化分析挖掘,以辅助医生解读医学影像,成为现代医学影像技术发展的重要需求。近年来,人工智能、机器视觉等技术的突飞猛进,深度神经网络模型在图像视觉识别中表现卓越,为医学影像分析提供了新思路,已被广泛应用在医学图像的分割任务中。利用深度神经网络模型对医学影像进行自动分割,可以提高医生的诊断和治疗效率,因此受到了众多研究人员的关注和研。然而,即使使用深度学习,医学影像的自动分割仍然是一个具有挑战性的问题。现有的方法也未能取得令人满意的结果,其原因可以从四个方面进行描述:(1)医学影像中的目标区域与周围的器官组织的对比度低,且解剖结构复杂,现有医学图像分割方法的精度低;(2)医学影像中的目标区域具有大小和形状多样性的特点,简单地通过下采样操作会丢失大量的语义信息,网络很难在这个任务中实现多尺度特征的学习;(3)相比自然图像,三维医学影像的分辨率更大,现有的注意力机制容易引入更多的训练参数,需要承受更大的计算负担;(4)医学影像中的病变区域具有多分布的特点,现有的基于区域级的损失函数难以精准地分割多分布的病灶。针对问题(1),本文设计了一种名为多结构响应滤波器(Multi-Structure Response Filter,MSRF)来提取3D结构的先验信息。与传统的方法相比,MSRF被设计用来增强其他具有特定几何结构的组织和器官,而不是增强待分割的结构。因此,增强后的图像可以指导分割网络区分图像中的待分割结构和相似的器官组织。针对问题(2),本文设计了一个多尺度上下文特征提取模块来充分捕获上下文信息。具体地,本文在U-Net的卷积块中使用空洞卷积来提取目标区域的多尺度特征。此外,由于医学影像数据集的数量小,具有大量可训练参数的模型容易导致过拟合,过度使用各种网络组件进行特征提取和融合并不适用于此任务。因此,本文在空洞卷积的基础上,引入残差连接,以实现更有效的多尺度特征学习。针对问题(3),本文首先利用三维结构先验信息来指导先验注意模块(Prior Attention Module,PAM)中的空间注意机制的执行,这有助于关键空间信息的恢复和融合。本文的PAM可以有效地模拟医学影像上不同区域的重要性,而不是从特征图中进行学习,这有助于模型提取与目标区域相关的特征。此外,为了减少注意力机制中的参数量的同时,提高模型对通道域和空间域的建模能力,我们提出了移位通道注意力模块(Shift-Channel Attention Module,S-CAM)。该算法通过移位部分通道特征的策略来对相邻通道中的特征关系进行建模,并且在无需引入额外的训练参数的前提下,增强相邻通道间特征的交互作用,进而提高判别性特征的表示能力。针对问题(4),本文提出了一个新颖的损失函数,称为Weighted-Region(WR)损失函数。WR是对现有的基于区域级的损失函数的改进。现有的基于区域级的损失函数直接计算多个区域的和,而我们的WR损失函数可以隐式地学习多个区域之间的权重,而不需要手动指定权重。在多分布目标的分割任务中,WR的目标是提高小目标区域的权重,缓解当大目标区域占多数时,小目标区域的分割难以被进一步优化的问题。最后,我们在三个数据集上对本文所提出的所有方法进行验证,分别为一个私有的食管癌数据集,两个公开的Li TS肝脏肿瘤数据集和3Dircadb肝脏肿瘤数据集。在食管癌分割任务中,食管癌分割的Dice Similarity Coeffificient(DSC)为84.839%,Precision为85.955%,Sensitivity为83.752%,Hausdorff Distance(HD)为2.583mm。在Li TS数据集的肝脏和肿瘤分割任务中,肝脏分割的DSC为96.9%,Volumetric Overlap Error(VOE)为2.56%,Average Symmetric Surface Distance(ASSD)为0.96mm。肿瘤分割的DSC为75.1%,VOE为21.09%,ASSD为1.08mm。此外,我们利用3Dircadb数据集来测试模型的泛化性能,肝脏分割的DSC为96.47%,VOE为9.68%,ASSD为2.98mm。肿瘤分割的DSC为74.54%,VOE为34.42%,ASSD为1.21mm。实验结果表明,所提出的方法在三个数据集中的表现性能均优于现有最先进的网络。