关键词:
机器学习
动脉粥样硬化
衰老
基因筛选
免疫浸润
药物预测
摘要:
目的探讨衰老相关基因在动脉粥样硬化(AS)发展中的作用, 并鉴定核心基因以预测药物靶点。方法利用RStudio的Limma包, 从基因表达数据库(GEO)下载的GSE100927基因表达数据集中筛选出差异表达基因。通过加权基因共表达网络分析(WGCNA)确定了差异显著的基因模块, 并从这些模块内筛选出与差异表达基因重合的基因。然后, 将这些基因与CellAge数据库中的衰老相关基因进行交集分析, 识别出与AS相关的衰老差异表达基因。通过最小绝对收缩和选择算子(LASSO)回归和支持向量机(SVM)进一步筛选这些基因, 确定关键基因。在GSE28829数据集中验证这些关键基因的表达情况, 并通过受试者工作特征曲线(ROC)再次验证了这些关键基因的诊断效能并使用xCell分析了差异基因在免疫浸润中的角色。最后通过DGIdb数据库对关键基因的药物相互作用进行预测。结果从数据集GSE100927中筛选出772个差异表达基因, WGCNA结果显示MEturquoise模块中的基因在AS组织中的基因显著性与其模块成员关系呈负相关。将从CellAge数据库获取了845个与衰老相关的基因与GSE100927的差异基因及MEturquoise模块中的基因取交集得到34个基因, 进一步的机器学习算法SVM-RFE和LASSO回归共筛选出6个衰老相关AS的关键基因, 分别是基质金属蛋白酶7(MMP7)、含溴结构域7(BRD7)、细胞周期蛋白依赖性激酶抑制剂2A(CDKN2)、磷酸甘油酸脱氢酶(PHGDH)、硒结合蛋白1(SELENBP1)、ⅡA组磷脂酶A2(PLA2G2A)。其中MMP7、BRD7、CDKN2、PHGDH和SELENBP1在数据集GSE43292中展现出明显的表达差异。DGIdb数据库筛选了针对核心基因MMP7、BRD7、CDKN2A、SELENBP1和PHGDH的潜在药物, 包括普啉司他、马立马司他、异丙嗪霉素等。结论通过机器学习算法筛选出的5个候选基因, 可能成为潜在衰老相关AS关键基因。