关键词:
胶质瘤
加权基因网络共表达分析
GRIN1
生物标志物
生物信息学
摘要:
目的:胶质瘤来源于神经上皮组织,成年人的发病比率约为8/10万人每年,是最为常见的颅内原发性肿瘤。即便采取最积极的临床治疗方案,胶质母细胞瘤患者的生存中位仅为12-15个月。因常规的手术治疗、放疗和化疗疗效不尽如人意,故而催生了大量关于胶质瘤靶向标志物的研究。生物信息学是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。本研究旨在利用生物信息学中加权基因共表达网络分析的手段鉴定与胶质瘤病理分级及预后相关的核心基因。研究方法:1、通过在线的开放式数据库Gene Expression Omnibus(GEO)及The Cancer Genome Atlas(TCGA)获取胶质瘤患者的临床数据文件及转录组数据文件。2、通过R语言编程软件(版本3.6.3)、PERL编程软件对所获得的胶质瘤患者的临床数据及转录组数据进行处理;通过载入Limma、edge R、pheatmap、ggplot2及WGCNA等软件工程数据包查找GEO及TCGA数据集中胶质瘤中的差异基因,并对差异基因进行加权基因网络共表达分析。通过构建模块图、树状图、热图及火山图将胶质瘤中的差异基因群及加权基因群进行可视化。3、通过R语言编程软件及Venn Diagram软件工程包绘制Venn图,构建胶质瘤差异基因群的交集基因。4、通过R语言编程软件及colorspace、stringi、ggplot2、Bioc Manager、Dose、cluster Profiler及enrichplot等软件工程包对交集基因群的生物功能进行Kyoto Encyclopedia of Genes and Genomes(KEGG)及Gene Ontology(GO)生物功能学富集分析。5、通过在线开放式数据库STRING,按照文本挖掘、既往实验报道、数据库载明的资料及基因的共表达、共进化、共融合等证据对交集基因群进行蛋白互作网络构建。6、通过生物信息学软件Cytoscape(版本3.8.2)及插件Cytohubba对交集基因的蛋白互作网络进行拓扑分析;基于最大中心性算法(Maximum centrality criterion,MCC)从交集基因中筛选与胶质瘤强相关的10位核心基因。7、基于R语言编程软件及Survival和Survminer,利用Kaplan-Meier的统计学方法对10位核心基因进行预后相关性分析;同时,利用在线开放式数据库GEPIA和LOGpc对10位核心基因进行表达量及预后的多亚组分析。8、对在胶质瘤中表达差异最显著,预后相关性最强烈的核心基因GRIN1进行临床相关性分析;基于TCGA数据库中胶质瘤患者的临床性状文件,利用R语言编程软件和Limma及ggpubr软件工程包对不同年龄及不同性别的胶质瘤患者进行GRIN1相关性的分析。9、通过开放式在线数据库HPA对GRIN1在胶质瘤及正常脑组织中的蛋白表达差异进行查证;同时,通过对在中国医科大学附属盛京医院神经外科在2021年4月30日至2021年8月27日手术的9例患者(3例胶质母细胞瘤;3例低级别胶质瘤,3例脑血管畸形)进行免疫组化分析,以鉴定GRIN1在不同胶质瘤分级及正常脑组织中的蛋白表达差异。结果:1、GEO数据集及TCGA数据集中均存在与胶质瘤高度相关的差异基因,其中从GEO数据集中鉴定得出511个差异基因,从TCGA数据集中鉴定得出5331例差异基因;GEO数据集中的宝石蓝模块(r=-0.73,p=9e-31)和TCGA数据集(r=-0.24,p=3e-04)中的宝石蓝模块与胶质瘤的负相关性调控关系最显著。2、Venn图得出在GEO数据集差异基因群、TCGA数据集差异基因群、TCGA数据集宝石蓝模块和GEO数据集宝石蓝模块中存在185个交集基因。3、KEGG富集分析得出,185个交集基因富集于钙离子信号通路中;GO富集分析得出,在生物过程模块(Biological process,BP),交集基因主要发挥调控化学突触传递;在细胞组分模块(cellular component,CC),交集基因主要作用于突触前期的调控;在分子功能模块(Molecular function,MF),交集基因主要作用于金属离子跨膜转运体的活性的调控。4、STRING数据库构架了185个交集基因的蛋白互作网络(r=0.4),Cytoscape及插件Cytohubba对该蛋白互作网络进行基于MCC拓扑分析,得到了与胶质瘤高度相关的10位核心基因,分别为:DLG4,GRIN1,GNB4,GNB5,GRIN2B,VAMP2,DLG3,F2R,ADRA1