关键词:
炎症性肠病
肠结核
机器学习
深度学习
诊断模型
摘要:
背景:炎症性肠病(Inflammatory Bowel Disease,IBD)主要包括溃疡性结肠炎(Ulcerative Colitis,UC)和克罗恩病(Crohn`s Disease,CD),是常见消化系统慢性炎症性疾病。肠结核(Intestinal Tuberculosis,ITB)是结核杆菌感染导致的肠道慢性感染性炎症性疾病。UC、CD和ITB的临床症状和内镜下表现非常相似,需结合临床表现、实验室检查、影像学检查、内镜和组织病理学检查进行综合分析并密切随访才能最终明确诊断。由于UC和CD均缺乏诊断的“金标准”,而ITB患者找到结核感染直接证据的阳性率又非常低,因此三者之间的诊断与鉴别诊断一直是临床工作中的难点。近年来,深度学习(Deep learning,DL)和机器学习(Machine learning,ML)作为重要的人工智能(Artificial Intelligence,AI)技术在医学领域得到了广泛的应用。其中DL主要应用于医学图像,ML主要应用于临床文本资料。现在已有不少AI与消化系统疾病的相关研究,主要集中在肿瘤性病变或癌前病变领域。虽然有少量研究关注AI在IBD领域的应用,但主要局限于对病情的评估和预后的预测,鲜有研究关注IBD与ITB之间的鉴别诊断。此外,目前大多数研究的重点是关注AI模型的性能和效果,对模型的可解释性,即AI模型做出预测的原理缺乏足够的解释。目的:利用临床资料研发DL模型与ML模型2种AI鉴别诊断模型用于UC、CD和ITB之间的诊断与鉴别诊断。并利用计算机方法(Grad-CAM、SHAP和LIME法)和传统的医学统计方法对AI模型的预测原理做出一定的解释。比较模型的性能,并在临床验证其性能。方法:1.收集UC、CD和ITB的肠镜图像,利用DL的方法训练和验证DL模型用于UC、CD和ITB的鉴别诊断。采用Grad-CAM法对模型预测的病灶进行定位,再通过分析模型预测值最高的图片中包含的特征信息,进一步解释模型预测的原理。2.收集UC、CD和ITB的临床资料数据,利用ML的方法训练和验证ML模型用于UC、CD和ITB的鉴别诊断。采用SHAP和LIME的方法对ML模型的预测特征进行分析从而解释模型预测的原理。3.通过肠镜图像与临床资料相匹配的病例数据集比较DL模型与ML模型的性能和一致性。4.前瞻性研究验证ML模型鉴别CD和ITB的性能,并比较ML模型与多学科诊疗(Multi-Disciplinary Team,MDT)的结果是否具有良好的一致性。结果:***模型(1)鉴别诊断价值:(1)鉴别UC和ITB的肠镜图像时,Xception表现最佳,AUC和正确率分别为0.819和0.849。(2)鉴别CD与ITB的肠镜图像时,Xception表现最佳,AUC和正确率分别为0.761和0.857。(3)鉴别UC和CD的肠镜图像时,VGG19表现最佳,AUC和正确率分别为0.864和0.791。(2)Grad-CAM法对DL鉴别诊断模型有鉴别意义区域(即病灶区域)进行准确定位。(3)有显著鉴别意义的特征性表现:(1)DL模型鉴别UC和ITB时:UC图片出现黏膜脆性增加、黏膜出血(60.0%vs 13.3%,P=0.021)的几率更高;ITB图片出现环形溃疡(40.0%vs 0.0%,P=0.017)的几率更高。(2)DL模型鉴别CD和ITB时:CD图片出现纵行溃疡(53.3%vs 0.0%,P=0.002)和铺路石样改变(73.3%vs 0.0%,P<0.001)的几率更高;ITB图片出现疤痕(33.3%vs 0.0%,P=0.042)的几率更高。(3)DL模型鉴别CD和UC时:CD图片出现纵行溃疡(53.3%vs0.0%,P=0.002)和铺路石样改变(73.3%vs 0.0%,P<0.001)的几率更高。***模型(1)鉴别诊断价值:(1)鉴别UC和ITB患者时,XGBoost表现最佳,AUC和正确率分别为:0.981和0.936。(2)鉴别CD和ITB患者时,XGBoost表现最佳,AUC和正确率分别为:0.946和0.884。(3)鉴别UC和CD患者时,XGBoost表现最佳,AUC和正确率分别为:0.963和0.891。(2)有显著鉴别意义的特征性表现:(1)ML模型鉴别UC和ITB最重要的3个特征分别是T-spot结果、直肠是否受累和大便隐血结果、是否腹泻和病程长短。(2)ML模型鉴别CD和ITB最重要的3个特征分别是T-spot结果、是否合并肺结核和起病年龄。(3)ML模型鉴别CD和UC最重要的3个特征分别是是否累及回末、就诊年龄和病理组织学是否有肉芽肿形成。***模型与ML模型鉴别诊断价值的比较(1)模型的效能(在肠镜图像与临床资料相比配的病例数据中):(1)DL模型鉴别C