关键词:
N-Gram模型
医学影像分类
视觉语料库
语义特征
显著性检验
摘要:
医学影像分类技术是计算机辅助诊断中的关键技术,但是“语义鸿沟”、数据不均衡、维数灾难等问题阻碍了分类模型在临床中的推广。作为经典语言模型,N-Gram模型对于解决该类问题展现出优越性能。该模型简单高效,能够在兼顾局部特征上下文信息的同时,基于统计学原理提取文本抽象的语义特征。本文通过使用学习迁移方法,将N-Gram模型的应用领域自传统的文本处理过程扩展至医学影像分类领域,并对该过渡算法进行了深入研究。首先,使用灰度变换函数对源影像进行编码;其次,通过滑动窗口采集样本的N-Gram视觉语料库,在此基础上利用约束条件以及显著性检验筛选出显著的N-Gram视觉语料作为样本的特征,其频率向量即为样本的特征向量;最后,使用分类器对影像目标进行分类。为检验算法性能,本文基于上述算法完成了甲状腺结节超声影像的良、恶性分类以及视网膜光学相干断层(OCT)影像的干性黄斑变性识别两项任务。为降低算法对噪声的敏感度,本文依据病灶影像学特点简化并改进了预处理过程,使用基于CV-RSF模型改进的算法完成任务一中的结节分割处理,使用基于各向异性扩散模型改进的算法完成任务二中的去除散斑点噪声处理。为测试算法对分类器的依赖度,本文使用了Fisher判别、SVM分类器以及BP神经网络三种经典分类器进行对比实验,最终它们在任务一中最高准确率分别为97.06%、100%、100%,在任务二中最高准确率均为99.61%。实验结果表明本文提出的算法分类性能优秀、泛化能力强、鲁棒性高且对分类器依赖度较低,为研究人员构建计算机诊断模型提供了一套高效的技术方法和研究思路。