关键词:
计算机断层扫描
医学影像检测与识别
特征融合
深度学习
卷积神经网络
摘要:
医学影像是临床疾病筛查、诊断、治疗和评估的重要工具。其中最具代表性的设备为计算机断层扫描系统(Computed Tomography,CT),因其对软组织器官的高敏感性,能够在解剖图背景上清晰地显示出病变区域的细节特征,从而获得高诊断价值图像。常规CT影像诊断工作完全依赖于阅片医生的经验,然而CT仅能从广角视野拍摄患者整体轮廓内的横切图像,这导致在复杂的器官组织背景中寻找出病灶区域耗时耗力,存在主观性强、效率低以及无法定量分析等问题。基于深度学习的计算机辅助诊断(Computer-aided Detection,CAD)系统凭借强大的特征提取与数据分析能力,实现自动检查、智能诊疗的目标,可以有效缓解医生的阅片压力。对于病灶或伤情区域的检测与识别是CAD中最为重要的任务之一,然而,CT影像中的病变区域相较于自然场景下的目标尺寸更小、边缘特征更弱,且与邻近组织的相似度极高,从而造成了临床检查漏检率、误检率居高不下。对此,本文针对CT影像复杂背景下的两种小目标病灶:肺结节与眼中异物的检测识别任务展开研究,分别结合其病灶图像特点设计出更加符合临床需求的检测与识别系统,具体研究工作如下:一、针对目前肺结节检测识别方法漏检率高、假阳性率高、流程复杂且计算冗余等问题,本文提出了一种基于内卷积与坐标注意力特征融合的肺结节检测与识别模型,该模型以YOLOv5为基准网络,通过端到端的运行机制直接输出肺结节的定位与分类信息,相较于其他算法展现出更强的鲁棒性。首先,本文建立了诊疗信息完善、病例种类齐全的肺结节病变诊疗数据集,解决了公有数据集图像资源不足的问题。然后,在YOLOv5特征提取网络的基础上设计并添加了两个新型模块,一是Transformer模块用于增强网络对CT图像空间全局特征的捕获能力,以降低假阳性率;二是Involution模块用于降低整体网络的计算量,以加快推理速度。最后,构建了一种新型的跨尺度特征融合网络,将高维度语义特征按重要性等级进行加权融合,将低维度定位特征与语义特征经过坐标注意力增强后再进行融合,该网络结构有助于深度挖掘模型中的语义信息以提升肺结节分类效果,同时增强低维定位特征的利用率,改善肺结节的漏检问题。最终在本数据集上进行对比测试,改进后的检测模型m AP@0.5指标达到了97.9,同时敏感度为96.1%、准确度为98.8%、特异性指标为84%,相较对比算法均有大幅提升。二、针对目前眼中异物伤情检测识别方法定位误差大、手工标注精度低、诊断速度慢等问题,本文提出了一种融合特征金字塔的轻量化眼中异物检测与识别模型。首先建立了完善的淮海地区眼中异物伤情诊疗数据集。然后,在轻量化网络Mobile Vi Tv3的基础上重新设计了倒残差结构,引入NAM-Attention注意力机制增强层提升对显著性特征的关注度,同时引入Si LU激活函数提高深层网络的计算精度,加快模型推导速度。最后,利用路径聚合特征金字塔网络以融合多尺度特征,实现网络不同层次间的信息交互,提升对眼中异物类型判断的准确率。特征金字塔网络中,本文通过SPPFCSPC模块重构空间池化层与卷积层的连接方式减轻了计算开销;通过SPD-Conv、Conv Mix模块捕捉深层网络中空间及通道方向上的关键特征,提升对于眼中异物的检测性能。这些轻量化模块优化了特征信息传递与网络计算的方式,并在提升检测识别准确率的前提下完成了对整体模型的轻量化改进。最终对比试验证明,本模型相关参数指标:m AP@0.5指标为97.2的、敏感度为98.0%、准确度为93.5%、特异性指标为88%。该论文共有图40幅,表9个,参考文献108篇。