关键词:
肺腺癌
微乳头结构
人工智能
摘要:
背景及目的
肺癌是全世界范围内最常见的恶性肿瘤之一,严重威胁人类健康。肺腺癌(Lung adenocarcinoma,LUAD)作为肺癌中最常见的类型,发病率和死亡率都排在前列。依据肿瘤的组织学形态,LUAD可以分成多种病理亚型。每一例LUAD中病理亚型的组成和比例都不尽相同,患者的预后也不相同。本研究通过开发一套人工智能辅助病理诊断模型,帮助病理医师准确、高效的识别经典型微乳头结构(Micropapillary pattern,MPP);通过研究E-cadherin、N-cadherin、Vimentin、β-catenin、Twist、Cyclin D1、Ki-67在丝状结构(Filigree pattern,FP)、肺泡腔内微乳头结构(Micropapillary pattern in air spaces,AMP)和间质微乳头结构(Micropapillary pattern in stroma,SMP)的表达情况,探讨FP、AMP、SMP在上皮间质转化(epithelial-mesenchymal transition,EMT)和细胞增殖活性的表达情况及其之间的差异;通过空间转录组学测序对FP、AMP、SMP进行生物信息学分析,寻找FP、AMP、SMP的差异基因和关键信号通路,了解FP、AMP、SMP的分子生物学特征,为后续研究提供一些新思路。
方法
1.微乳头结构的识别
收集2019年5月-2022年6月在陆军特色医学中心经手术切除的LUAD(原位腺癌、微小浸润性腺癌、浸润性腺癌)、非典型腺瘤样增生(Atypical adenoma hyperplasia,AAH)、浸润性黏液腺癌(Invasive mucinous adenocarcinoma,IMA)、细支气管腺瘤(Bronchiolar adenomas,BA)、硬化性肺细胞瘤(Sclerosing pneumocytoma,SPM)、肺泡上皮反应性增生(Reactive hyperplasia of alveolar epithelial cells,RHAEC)、正常肺组织总计7个病种340例病例,由4名病理医师分类标注为6018张图像,包括LUAD4654张(MPP572张,贴壁结构(Lepidic pattern,LP)1434张,腺泡结构(Acinar pattern,AP)1448张,乳头结构(Papillary pattern,PP)404张,实体结构(Solid pattern,SP)796张),AAH430张,IMA80张,RHAEC282张,BA128张,SPM342张,正常肺组织102张。按照6:2:2的比例分层随机抽样组成训练集3628张、测试集1195张、验证集1195张,对模型进行训练、测试和验证。数据使用SPSS 26.0进行χ2检验、风险评估以及SPSSAU 22.0进行协调系数分析。
2.免疫组化染色
收集2021年6月-2023年1月在陆军特色医学中心经手术切除的LUAD共895例,按照纳入排除标准筛选出符合要求的病例总计40例,其中FP(+)39例,AMP(+)38例,SMP(+)22例。收集患者的一般情况,包括性别、年龄、吸烟史、饮酒史等,以及相关的临床病理特征,包括肿瘤最大径、胸膜侵犯、脉管内癌栓、气道播散等。所有标本经10%中性福尔马林固定、石蜡包埋、常规切片后进行En Vision法免疫组织化学染色。数据使用SPSS 26.0进行χ2检验、Fisher确切概率法的统计学分析,以P<0.05时具有统计学意义。
3.空间转录组测序及生物学信息分析
收集2022年1月-2022年6月在陆军特色医学中心经手术切除的LUAD共243例,按照纳入排除标准,在模型的辅助下筛选出符合要求的病例总计8例,其中FP(+)7例,AMP(+)8例,SMP(+)5例。制作8个样本的组织芯片进行空间转录组学测序,按照差异倍数>2,P值<0.05的标准筛选,分析FP、AMP、SMP的差异基因,并对其进行GO功能富集、KEGG通路富集。
实验结果
1.构建人工智能辅助诊断模型
开发一套人工智能辅助LUAD病理诊断模型—FL-STNet。FL-STNet的诊断准确率为86.0%,与高年资病理医师组(P<0.01)和低年资病理医师组(P<0.001)的比较中诊断准确率最高,kendall协调系数=0.979。
2.不同微乳头结构的免疫组化表达特征存在差异
E-cadherin在FP、AMP、SMP中的表达主要定位于细胞膜,阳性表达率均为100%,阳性强度平均值为25.00、21.32、17.36,差异具有统计学意义(χ2=16.382,P<0.05);N-cadherin在FP、AMP、SMP中的表达主要定位于细胞膜,阳性