关键词:
乳腺癌
计算机辅诊系统
机器学习方法
深度神经网络
可解释性
摘要:
乳腺癌疾病诱发因素众多,致死率高,严重危害女性身体健康。超声检测操作简单、无痛无创、无辐射是乳腺肿瘤前期诊断的主要影像学方法。超声检测的数据形式是乳腺超声图像和超声报告,美国放射学会制定的乳腺影像学报告及数据系统BI-RADS对超声报告进行了严格的规范。依据超声数据和医生专业知识的诊断方式主观性强,高度依赖医生个人能力,计算机辅诊系统CAD结合人工智能和医学诊断技术,辅助发现病灶,分类病灶,有助于降低漏诊率和提高医生工作效率。早期的辅诊系统在乳腺超声图像上通过人工或算法提取图像的纹理和形态的特征,组成特征向量,训练机器学习模型。近几年,以“深度神经网络”为代表的深度学习理论逐渐成熟,其表征空间维度高,提取出的特征比人为设定的特征有更强的泛化性能,不断应用在健康和医疗领域。为了探索深度学习在乳腺癌诊断上的应用,本论文在乳腺超声数据集上有针对性的设计了基于CNN的分类器,依据专业医师的标准病灶分割,在训练集准确率ACC为0.7866,验证集为0.8。此外,超声样本天然存在的正负样本不均衡问题,导致相对重要灵敏度偏低,论文试验了两种优化损失函数的方法并取得了良好的效果,验证集上Bias-Loss方法ACC为0.8222,敏感度为0.8667,特异性为0.7556;Am-Loss方法ACC为0.86,灵敏度为0.9565,特异性为0.78,两种方法都有效的提高了准确率和灵敏度。应用深度学习方法来辅助决策,尤其是对医学影像进行辅助诊断时,决策过程和输出结果的可解释性不足,与循证医学理念存在较大的差异。限制了医生和患者对算法的信任度。为了提高模型的可解释性,推进深度学习算法在乳腺肿瘤诊断上的应用,论文在设计诊断系统的同时尝试通过热度图和语义回归两种方法对模型进行可解释的评价,热度图有效的发现了模型关注区域,语义回归帮助发现了模型的重要特征。最后,论文整合上述工作,开发了具有自动分割病灶,分类病灶,可解释描述功能的乳腺超声辅诊系统的客户端程序。