关键词:
深度神经网络
医学图像分析
细粒度图像分析
知识蒸馏
特征学习
摘要:
随着成像技术的不断发展与完善,医学影像数据飞速增长,从业医师的缓慢培养速度已逐渐无法满足医疗行业日益增长的阅片需求,国内医疗资源正面临巨大压力。计算机辅助诊断作为缓解这一切实矛盾的重要途径,备受工业界、学术界乃至整个社会的广泛关注。然而,医学图像与常见自然图像存在极大区别,其背景更复杂,关注区域(病灶)更小,特征变化更细微,类间关系更复杂。因此医学图像分析的一大研究重点是区分图像间的细微差异,即细粒度识别。现阶段面向医学图像的细粒度识别方法与临床诊断的实际需求仍有较大差距,在小病灶识别、弱监督分类、疾病多分类方面仍存在重大挑战有待解决:
1.小病灶识别——“漏诊、误诊”
在医学图像,如脑转移瘤MRI中,背景里的细小组织(如血管)常呈现与小病灶高度相似的信号,会干扰模型的学习,导致出现假阳性预测。另外,病灶的尺寸跨度大,不同尺寸病灶个体间相互干扰,会进一步影响模型识别小病灶的能力,导致发生漏诊现象。现有方法多关注类别间的不平衡,通过引入轮廓信息或基于区域的损失来提升模型对特定类别的敏感性,忽略了对特定尺寸病灶的学习,往往整体指标高,但小病灶识别精度低。
2.弱监督分类——“精度不足”
医学图像,如乳腺X光,多具有高维度、低信噪比的特点。通过引入分割掩膜、检测框等高精度标签可以排除噪声信息并放大病灶区域的特征,从而提高模型的精度,但对标注人员有严格的专业水平和经验要求,难以推广。而基于图像级标签构建弱监督分类模型,因缺乏对病灶位置的监督,会导致细粒度的纹理和边缘等信息在特征提取过程中逐渐被噪声淹没,从而丢失关键信息,进而影响模型的泛化性和精度。
3.疾病多分类——“相似类易混淆”
在疾病多分类,如皮肤病多分类任务中,不同疾病之间的关系错综复杂,区分不同类别所需的关键因素也有着粒度上的区别,相似类别间的关键辨别性因素粒度更细,较远类别间的辨别性因素粒度更粗。现有方法多忽视类别关系直接对所有疾病分类,会导致网络对粗粒度信息的学习干扰对细粒度信息的学习,从而使模型容易混淆相似类别。目前,较少有研究涉及到类别相似性的刻画与直接利用。
针对上述三个方面的挑战,论文从细粒度分解、细粒度特征增强、类别关系耦合等方向出发,开展面向医学图像的细粒度识别方法研究,并开发了相应的智能辅诊系统。其中研究细粒度分解方法旨在缓解在强监督条件下小目标的漏检和误检问题,提出了将图像信息分解至不同粒度的网络结构和基于像素粒度的损失函数,并研发了脑转移瘤智能检测系统且已投入临床试验;研究细粒度特征增强方法旨在解决弱监督条件下细粒度信息易被淹没的问题,提出了两种基于局部区域特征筛选的细粒度特征增强算法,并研发了乳腺X光智能筛查系统且已投入临床使用;研究类别关系旨在解决多病种识别任务中细粒度类别易混淆的问题,探索了类别关系的量化方法,并提出了两种耦合类别关系的细粒度识别算法。本文的特色与创新如下:
1.基于细粒度分解的脑转移瘤识别模型
针对病灶与背景组织难以区分导致的误诊问题,设计了基于粗-细粒度信息融合的跨切片网络,引入切片维度的外部信息和额外监督,通过可训练的门控特征融合模块实现了由粗到细的病灶预测流程,进而加强模型对背景组织和前景目标的区分,降低误检率。针对病灶尺寸跨度大的特点,将病灶的学习从区域粒度细化至像素粒度,并设计了基于像素加权的损失函数,用以增强分割模型对“难”识别像素的学习,提高检出率。实验采用脑转移瘤MRI数据进行分割任务,结果表明,粒度分解方法可以有效提升模型对小病灶的检出率,可训练的门控模块可以有效降低假阳率。基于上述模型,研发了脑转移瘤智能检测系统,以辅助医生快速定位脑转移瘤,提高阅片效率。该系统已投入临床试验,在实际应用中验证了所提方法可以促进模型对小病灶的识别,降低漏检误检率。
2.基于细粒度特征增强的乳腺X光分类定位模型
在弱监督条件下,针对细粒度信息易被淹没的问题,本文基于乳腺X光背景大病灶小的特点,设计了基于区域的池化结构筛选全局特征捕捉可疑局部细粒度特征,设计了基于全局的池化结构筛选局部细粒度特征重组全局特征,以消除背景信息并增强图像中的细粒度特征的表达。在此基础上,为进一步改善细粒度特征筛选的效果,提出了局部极值映射方法,以较显著的极值作为选择细粒度特征区域的条件,实现了对细粒度特征的进一步强化。实验采用乳腺X光数据进行良恶性分类,结果表明,所提方法不仅可以在传统分类指标上超过已有方法,还能提供额外的病灶位置信息。基于上述模型,研发了乳腺X光智能筛查系统,以辅助医生进行乳腺X光良恶性的快速分类。该系统已投入临床使用,在实际应用中验证了模型提供的病灶位置信息可以有效提高医生的临床诊断效率。
3.耦合细粒度类别关系的皮肤病分类模型
针对相似病灶易混淆的问题,提出了类别相似性关系的量化方法和多粒度标签的聚合算法,并基于此设计了一个通过解