关键词:
医学影像辅助诊断
深度学习
小样本与类不均衡问题
多任务学习
注意力机制
调和损失函数
半监督学习
摘要:
医学影像辅助诊断是医学影像分析领域的关键问题之一,在现代临床疾病诊断中发挥着重要作用。近年来,深度学习技术凭借其优异的特征表达能力和强大的数据拟合性能,已经被广泛地应用于各种医学影像辅助诊断任务中。然而,作为一种数据驱动的建模方法,深度学习严重依赖大量样本训练模型,并且数据集中不同类别间样本数量不均衡的问题也会严重影响深度学习模型的性能表现。受限于样本获取途径少、标注成本高、数据隐私性强以及不同类型疾病发病率差异大等问题,医学影像数据集往往存在样本数量少和类间样本数量不均衡的问题,这给构建高性能的深度学习分类模型带来了极大挑战。为应对上述挑战,本文聚焦于医学影像辅助诊断中的小样本分类和类不均衡分类关键问题,从多任务学习、注意力机制、损失函数优化和半监督学习等关键技术入手,提出多种小样本分类方法与类不均衡分类方法,有效降低了深度学习模型对庞大数据量和不同类型间样本数量均衡性的要求。本文的主要研究内容和创新点概括如下:(1)提出一种基于多任务学习和孪生网络的小样本分类方法。针对深度学习模型在小样本医学影像辅助诊断任务中难以提取类间样本区分性特征的问题,基于多任务学习,通过设计能够获取同类样本相似性和不同类样本差异性的辅助分类任务,并将其与常见的分类问题相结合,构建了 一个深度孪生网络(Deep Model with Siamese Network,DS-Net),有效地提升了深度学习模型在小样本数据集上的分类性能。DS-Net模型由一个基于孪生网络的辅助监督网络(Auxiliary Supervision Network,ASN)和一个普通的分类网络(Classification Network,CN)组成。在DS-Net模型的构建过程中,为了增强模型的特征提取能力,提出膨胀残差模块(Dilated Residual Block,DRB)和DRB网络,并基于DRB网络构建ASN和CN的主干网络,使模型能够提取同一尺度不同感受野的特征。在模型训练时,DS-Net模型利用成对学习的思想,以成对的数据作为输入,ASN通过判断成对样本是否属于同一类来提取类间差异和类内相似特征;分类网络执行目标分类任务,并利用ASN提取的区分性特征提高自身分类性能。在测试阶段,DS-Net模型无需使用成对样本,仅利用单一输入数据即可得出预测结果。在基于病理图像的骨肉瘤坏死区域评估问题上的实验结果显示,DS-Net能够获得95.10%的平均准确率,取得了目前最好的诊断结果。(2)提出一种基于密集连接注意力机制的小样本分类方法。针对深度学习模型在小样本医学影像辅助诊断任务中对样本关键区域关注度不够的问题,从空间注意力机制的角度出发,提出一个密集连接注意力网络(Densely Connected Attention Network,DenseANet),并在基于胸部CT影像的新冠肺炎(新冠感染)智能诊断任务中进行验证。在模型构建过程中,为了充分利用深度学习模型中的自注意力特征,设计了一个用于生成强注意力特征的密集连接注意力模块(Densely Connected Attention Block,DAB),并通过密集连接DAB模块内部和DAB模块之间相同尺度的注意力特征,构建了密集连接的注意力子网络(Densely Connected Attention Sub-Network,DA-SNet);同时,为了进一步增强模型对高阶特征的表征能力,在模型末端设计了一个能够密集连接不同尺度注意力特征的注意力特征聚合模块(Densely Connected Attention Feature Aggregation Block,DA-FAB),进一步增强模型的特征表达。随着深度学习模型网络层数的增加,不同尺度和不同深度的空间注意力特征被密集连接而逐渐向模型后端传递,使DenseANet模型能够依据强注意力特征输出诊断结果。实验结果表明,DenseANet可以有效定位被SARS-CoV-2病毒感染的肺部病变区域,并且能够以平均95.69%的准确率将新冠肺炎、普通肺炎和健康人群进行区分,优于现有的注意力模型。(3)提出一种基于主动注意力机制的小样本分类方法。针对深度学习模型在小样本医学影像辅助诊断任务中难以精确定位病变区域的问题,设计了一个基于先验知识的主动注意力网络(Prior Knowledge-based Active Attention Network,PKA2-Net)模型。PKA2-Net 由残差块、主体增强和背景抑制(Subject Enhancement and Background Suppression,SEBS)模块以及候选模板生成器构成,其中,模板生成器用来生成候选模板,以描述特征图中不同空间位置的重要性;SEBS模块是PKA2-Net的核心,用于生成主