关键词:
中医舌诊
高光谱成像检测
失眠分类
数据处理
摘要:
睡眠占人类生产生活三分之一的时间,是维持健康和生命活动不可或缺的环节。然而失眠已经成为现代社会普遍的睡眠障碍,约有10%~15%的成年人患有失眠症,且多数症状持续10年以上,严重影响个体的身心健康。根据中医理论,舌象特征的变化与睡眠质量有关。中医舌诊作为传统中医四大诊断方法之一,在临床疾病诊断和疗效评价中具有重要的价值,即通过观察舌质、舌苔、舌形等特征来判断人体的健康状况和指导临床辨证用药。舌诊在中医诊疗中占据重要地位,医护人员往往通过观察舌象以了解病情。然而,传统舌诊依赖于医者的经验和患者的依从性,这在一定程度上影响了舌诊的准确性与客观性。因此,面对日益严重的失眠问题,亟需引入现代化、信息化的技术手段,提升失眠诊断的客观性和效率。
高光谱技术具有信息量丰富、精细等优点,可以获得舌象在数百个光谱波段的反射信息。为实现失眠的快速诊断,本研究结合高光谱成像技术、机器学习和深度学习算法,开展了对失眠舌象与健康舌象的分类研究。主要研究内容与结果如下:
(1)基于高光谱技术的数据集研究与采集。本研究构建了舌象数据采集平台,利用特制的高光谱相机对失眠患者和健康受试者的舌象进行采集,并对采集的数据进行了标定。根据许家佗舌象分区理论,本研究将舌象划分为五个区域:舌左、舌右、舌根、舌中和舌尖,并将这些区域定义为感兴趣区域(Region of Interest,ROI)。再利用ENVI软件提取每个感兴趣区域的平均光谱数据,作为该区域的光谱数据。同时获取相应的图像数据,并对提取的光谱和图像数据进行了预处理。
(2)基于光谱数据构建失眠舌象分类模型。本研究分析了舌象五个区域的平均光谱曲线。采用归一化(Normalization)、卷积平滑(S-G)、标准正态变量变换(SNV)等六种预处理方法,单独或组合使用对光谱数据进行预处理。在此基础上,分别使用随机森林(RF)、卷积神经网络(CNN)和BP神经网络分类方法建立了失眠舌象分类模型,并以模型的准确率作为评价标准,进行对比分析。实验结果表明,CNN模型在对各舌象区域分类时表现最佳,其中舌尖区域数据经过Min-Max+S-G+SNV预处理后,分类效果最佳,测试集准确率达到了95.83%。
(3)基于图像特征构建失眠舌象分类模型。本研究对舌象各个区域的高光谱图像数据进行了预处理,再对其进行降维处理,然后提取舌象五个区域主成分图像的纹理特征。最后,基于所提取的图像特征,构建了卷积神经网络(CNN)、K-近邻(KNN)和BP神经网络等分类模型,并通过对比模型的准确率,筛选出最优模型。实验结果表明,在未经预处理的舌象各区域分类任务中,CNN模型表现最优,且测试集分类准确率均达到了87.5%。
(4)基于图谱融合特征构建失眠舌象分类模型。本研究将舌象各个区域的光谱数据与图像数据进行数据级和特征级的融合,构建了图谱融合数据集。基于该融合数据集,建立了卷积神经网络(CNN)、K-邻近(KNN)、BP神经网络和支持向量机(SVM)分类模型。实验结果表明,在数据级融合的情况下,CNN模型表现出最佳的分类效果,尤其在舌中区域的分类表现最为突出,测试集准确率达到了91.67%。