关键词:
图像分类
医学图像
深度学习
注意力机制
残差连接
摘要:
近些年来,计算机辅助诊断(Computer-aided diagnosis,CAD)已成为医学影像学和放射诊断学的主要研究课题之一。从芝加哥召开的北美放射学会(RSNA)年会以来,关于CAD相关主题的论文数量每年都在大量增加。许多不同类型的CAD方案正在开发中,用于检测和/或描述医学成像中的各种病变,包括常规投影X射线技术、计算机断层扫描(Computed Tomography,CT)、磁共振成像(Magnetic Resonance Imaging,MRI)和超声波(Ultrasound)。目前正在接受CAD研究的器官包括胸部、结肠、大脑、肝脏、肾脏以及血管和骨骼系统。CAD的基本概念是提供计算机输出作为“第二意见”,以帮助放射科医生读取图像。因此,为了开发成功的CAD方案,不仅需要开发计算机算法,还需要研究计算机输出对放射科医生的诊断有多有用,如何量化计算机输出对放射科医生的益处,以及如何最大限度地发挥计算机输出对诊断的影响。因此,使用可靠的方法(如接收器操作特征分析)对放射科医生进行大规模观察者性能研究,与CAD领域计算机算法的开发同等重要。因此,CAD的研究和开发需要不同背景的研究人员的团队努力,如物理学家、放射科医生、计算机科学家、工程师、心理学家和统计学家。Covid-19是一种新型冠状病毒,在2019年年末开始全球范围性爆发。随着疫情在各国迅速传播,大多数国家由于没有及时形成有效的预防措施。同时,各国面临着医疗资源严重短缺的问题,造成感染和死亡人数激增,尤其在贫困地区和国家。由于使用的核糖核酸检测(RT-PCR)成本高昂,检测时间过长,医务人员主观评断等因素容易导致误判,这些问题促使我们研究一种深度学习模型用于帮助医务人员使用医学影像检测COVID-19病例。并且考虑到以上全球各地区地的各种因素,我提出了以下两种基于深度学习的COVID-19医学图像自动识别的人工智能方法。(1)针对COVID-19肺部X-Ray图像特征本文提出深度学习方法MLES-Net。考虑到COVID-19患者的X-Ray图像类别间相似度高且类别内变异性低的特点,我们针对性地设计了一种多层级增强感知模块(Multi Level Enhanced Sense,MLES),并以此模块为基础提出一种新的卷积神经网络MLES-Net对COVID-19的肺部X-Ray图像进行分类识别。本文提出的深度学习方法MLES-Net在两个开源数据集的基础上,对MLES-Net进行评估,实验结果表明MLES-Net56-GAPFC在整体准确率(95.27%)和针对COVID-19类的识别率(100%)均达到最佳。而与其他同类型方法相比,此方法的MLES-Net56-GAPFC不管是在模型训练速度,模型参数大小,还是检测结果准确率也表现不错。(2)针对COVID-19肺部CT图像特征本文提出深度学习方法RSP-Net。由于患者的CT图像则表现为肺部多发小斑片影及间质改变,肺外周较明显,进展后发展为肺部多发磨玻璃混浊/肺磨玻璃影(GGO)、浸润影。针对患者的胸部CT图像特点,我们引用了双重注意力机制,以通道注意力机制和空间注意力机制为基础进行特征提取,并对两种注意力机制以并联和串联的方式进行试验,提出了一种新的卷积神经网络RSP-Net用以对COVID-19的肺部X-Ray图像进行分类处理。在开源数据集上,实验结果表明,RSP-Net(parallel)具有94.55%的准确率。通过对比实验结果的分析和与其他方法的对比,本文的模型对COVID-19患者的CT图像的分类能力表现良好。与此同时,为了提高识别效率,本文提出的两种方法的网络模型都采用三种分类器进行分类,一层全连接层(Fooling Connected Layer,FC),全局平均池化层(Global Average Pooling Layer,GAP)模块和GAPFC模块。其中,经参数量和计算量比较,选择GAPFC作为分类器的两种网络模型在各方面表现都综合最优。