关键词:
消化系统癌症
并发症
疾病预后
多效基因组
通路分析
摘要:
疾病合并症是指一种疾病或多种疾病同时存在于患者体内,与单一疾病相比,合并症会给患者带来额外的痛苦。但是,合并症状通常存在潜伏期较长的特点。因此,识别潜在的合并症有助于在治疗疾病时预防这些合并症,了解合并症之间的遗传联系有助于疾病管理。但目前已知的大多数疾病合并症都是在临床中偶尔发现的,我们对合并症遗传联系的了解也远远不够。
家系研究表明,多种消化系统癌症类疾病受到遗传因素的调控,并且可以通过评估遗传力和遗传相关性,发现疾病间的共享遗传基因元素。在基因组学时代,全基因组关联分析(GWAS)通过评估基因组中数千万个常见遗传多态性位点(SNP)为探索疾病的遗传结构提供了新的机会。考虑到消化系统癌症与非消化道癌疾病之间的合并症性是当今人类遗传学的主要研究领域,在本文中,通过遗传分析探索了与消化系统癌症类复杂性状遗传学研究有关的两个主要领域,即鉴定复杂疾病易感基因和疾病间共享遗传病因学因素。研究结果如下:
(1)针对五种消化系统癌症与某些疾病的遗传关系分析问题,本研究通过收集和整合疾病并发症的基础因素,如来自Mala Cards、GWAS Catalog和UKBB的疾病相关SNP或基因,以及UKB的健康记录(458,038人),我们对18个类别的150种疾病进行了调查,在此提出了一个包含548个基因的多效基因组。在建立了五种消化系统癌症与其他疾病之间的合并症目录和综合多效基因组之后,试图探索合并症与其共享遗传因素之间的关系,不仅基于重叠易感基因的比率,还基于共享通路和蛋白互作(PPIs)的比率。研究结果表明,相关性(几率比)更高的疾病配对往往在PPI网络中表现出更强的联系,这表明,PPIs有可能介导疾病之间的合并症关系;还表明并非每个类别中的所有疾病都主要由基因驱动和促进,有些疾病可能更多地受到环境因素、生活方式或治疗诱导因素的影响,且这种多样性可能反映了这些疾病背后的遗传危险因素的疾病类别异质性。
(2)针对五种消化系统癌症与合并症的多效性基因和通路探索的问题,本研究使用R软件包"epigraphdb"中的查询功能"query epigraphdb"向Epi Graph DB API端点提交数据请求。随后,我们提取了与这些基因和蛋白质相关的特定通路的信息,在实施过程中,我们导入了每对疾病的重叠易感基因并且确定疾病配对中多效性结构的标准。当与单个SNP相连的一组蛋白质被映射到相同的生物通路和/或表现出蛋白质-蛋白质相互作用时,我们认为该SNP更有可能是通过纵向多效性发挥作用的,否则我们就把它归类为横向多效性。进一步,计算每种蛋白质在共享通路和PPIs中的综合频率,以找出可能导致消化系统癌症与其他疾病并发的枢纽基因,我们发现TP53、KRAS、CTNNB1和PIK3CA等基因出现在五种消化系统癌症的高发枢纽蛋白中。研究结果表明,这些众所周知的消化系统癌症致癌基因和抑癌基因可能会驱动或介导五种消化系统癌症与其他145种疾病之间的多效性。最后,在功能富集分析中,使用R软件包"msigdbr"中的"msigdbr"函数获得了基因集,为了确定富集的统计意义,我们使用了超几何分布,使用了R软件包'stats'中的'phyper'函数。研究结果表明,MHC(主要组织相容性复合体)和抗原相关基因集,应成为未来研究的重中之重。通过深入研究这两种疾病同时发生的遗传发病机制,更好地了解它们相互关联的发病过程有助于更有效的疾病预防和早期干预,最终为患者带来更好的结果和预后。