关键词:
医学影像识别
深度学习
时间序列分类
宫颈癌
食管癌
摘要:
医学影像在疾病诊疗中起着关键性作用。近年来,医学影像筛查手段的普及带来了海量的临床图像数据,与日俱增的阅片量导致了医学影像医生的超负荷工作。随着深度学习技术和神经网络的发展,计算机辅助诊断(Computer-Aided Diagnosis,CAD)实现了很大的成功,通过对医学影像进行自动化分析和解读,CAD系统能够为患者提供疾病风险评估和辅助判断,从而帮助医生提高诊断效率和精度。作为智慧医疗的重要环节,CAD技术在癌症早筛和个性化医疗等领域具有广阔的应用前景。然而,现有CAD技术长期局限于器官或特异性癌症类型,识别跨癌种样本数据的模型发展仍受到了限制,跨癌种辅助诊断技术研究具有重要意义。
具体地,跨癌种医学影像中的辅助诊断在轻量化细胞分割、跨域细胞分类和样本分级三种场景下有不同的关键技术需要深入研究。轻量化细胞分割针对跨癌种样本图像,由于细胞核内染色质呈现多样化、整体图像背景复杂且存在重叠细胞干扰,使得细胞分割存在轮廓定位不准确、效率较低等问题。跨域细胞分类针对不同域源的独立细胞图像,由于域共享信息匹配度差、细胞特征来源单一,导致现有跨域细胞分类模型的性能较低。样本分级针对包括宫颈癌、食管癌在内的跨癌种样本图像,由于现有诊断原则的限制,使细胞层分类结果无法准确推广到样本层分级,导致分级模型存在精度较低、鲁棒性较差、无有效中间结果和定量分析以及可解释性弱等问题。本文分别研究了以上三种场景下辅助诊断的关键技术,主要工作内容和研究成果如下:
(1)针对跨癌种细胞分割中轮廓定位不准确、分割效率较低的问题,提出了一种基于轻量化分层结构的细胞分割与重叠检测方法,该方法基于上层分割结果逐层优化模型初始参数,实现了弱数据依赖下的快速、精确细胞分割。为了解决跨癌种细胞图像标准差异和质量不一的问题,基于各向异性扩散去噪算法和决策树设计了弱监督预处理模块,提升了原始图像数据的固定信噪比。为了提升细胞轮廓的定位精度,设计了基于扩展分水岭和梯度矢量流蛇模型的分层细胞分割结构,并通过协同参数初始化提高了细胞分割的效率,改善了模型的收敛性能。为了提高重叠细胞的检测效果,结合形态学处理与多重判据实现了细胞轮廓和凹点的再匹配,并通过分组更新规则和椭圆拟合构造黏连细胞的分割曲线,从而获得了更为精准的重叠细胞轮廓。实验使用两个自建数据集和两个公开数据集的跨癌种样本图像,对提出的方法进行验证。实验结果表明,提出方法可以获取到更为准确的细胞边缘,并对黏连细胞实现了有效检测和剔除,与其他细胞分割算法相比,提出方法具有更高的分割效率,有效解决了跨癌种细胞图像分割效率较低的问题。
(2)针对跨域细胞分类中域共享信息匹配度差、特征来源单一的问题,提出了一种基于混合特征学习的跨域细胞分类网络,该网络利用不同图像域的全部数据,通过混合特征学习和跨域特征匹配对不同来源的细胞特征实现了分类求解空间的交叉,并基于跨域高维特征对细胞样本实现了有效分类。为了解决域共享信息提取中的跨域匹配问题,设计了基于域共享分类器和域判别器的对抗网络,来确保不同域源细胞特征的联合分布匹配,并对深度网络进行同步参数优化,以接收更多输入流来提升匹配算法的兼容性。为了提升跨域细胞分类的精度,设计了基于深度特征和专家特征的混合特征学习,通过综合两类特征的互补性,将特征融合操作推广到更一般的形式,从而提升了分类模型的泛化能力。为了简化分类网络模型参数、提升深度特征的提取效率,设计了基于符号哈希函数的哈希学习层,通过将高维实值特征转化为二进制编码,加速了跨域分类网络的训练过程,同时降低了训练成本和算法空间复杂度。实验使用两类三组独立数据集,包括两个宫颈细胞数据集和一个食管细胞数据集,对提出的方法进行验证。实验结果表明,提出方法能够利用不同域源的混合特征对跨癌种细胞实现有效分类,相比其他跨域分类算法,混合特征和跨域联合匹配操作显著提升了网络的分类性能,有效解决了跨域细胞分类中域共享信息匹配度差和特征来源单一的问题。
(3)针对现有样本分级模型精度较低、鲁棒性较差、无有效中间结果和定量分析以及可解释性弱等问题,提出了一种细胞时间序列驱动的样本分级框架,该框架以细胞时间序列特征为基础,设计并加入了细胞光密度特征、模糊非线性回归、融合长短期记忆网络等模块,实现了跨癌种样本图像的分级检测。为了减小细胞倍体的计量误差,设计了一种针对细胞脱氧核醣核酸含量的精密计算与校正策略,结合模糊非线性回归算法和细胞特征集复用,精确描述了细胞核内遗传信息的量,从而提升了倍体计算的精度。基于矫正后细胞倍体数据,构建了上皮细胞时间序列,并设计了一种基于融合信息的时间序列特征提取与样本分级模型,提升了跨癌种样本分级的精度和鲁棒性。实验使用三组跨癌种样本数据集,包括一个宫颈样本数据集和两个食管样本数据集,对提出的框架进行验证。实验结果表明,基于