关键词:
新型冠状病毒
高通量测序
基因组变异
重组
进化
摘要:
2019冠状病毒病(Corona Virus Disease 2019,COVID-19)于2019年底率先在武汉地区被报道并引起疫情暴发,随后在全国及世界各地引起广泛传播并迅速升级为全球重大公共卫生事件。全球经历了由Alpha、Beta、Delta、Omicron等新型冠状病毒(SARS-CoV-2,简称新冠病毒)变异株引起的多轮疫情高峰。截止2023年9月21日,全球报告的COVID-19确诊病例数已达770,778,396例,死亡病例达6,958,499例。这场全球大流行被视为二十一世纪影响最广泛、危害最严重的传染病疫情之一。随着人群免疫力提升,死亡率逐步下降,卫生系统承压减轻,全球疫情呈好转趋势,多数国家恢复到过去熟悉的生活。2023年5月5日,世界卫生组织宣布新冠疫情不再构成“国际关注的突发公共卫生事件”,然而这并不意味着新冠疫情不再是全球的健康威胁。新型冠状病毒(SARS-CoV-2)并非人类历史上第一次引起传染病疫情的冠状病毒种类,实际上,在近20年的时间里,新冠疫情之前,冠状病毒已经引发了另外两起具有重大影响的大规模疫情。由冠状病毒引起的这三次重大疫情的暴发表明了冠状病毒具有的高度变异性,对人类社会构成巨大的潜在威胁。随着时间推移,病毒发生的变异可能会影响其传播能力、致病性以及对现有治疗手段和疫苗的敏感性。对新冠病毒变异和进化规律研究有助于深入了解该病毒特性,帮助预测和应对可能产生的影响,从而更有效地制定和调整防控策略。高通量测序和基因组学技术为研究病毒的变异和进化扮演着不可或缺的角色。高通量测序技术能在极短时间内获取病毒或其他病原体的基因组信息,对这些基因组测序数据进行深入分析,能帮助研究人员在疫情初期迅速鉴定新冠病毒,并实时监测其在全球范围内的传播和变异,深入挖掘该病毒的进化规律。本研究以新型冠状病毒为研究对象,使用高通量测序技术、比较基因组学和群体遗传学方法,从以下三个方面开展研究:(1)建立针对新冠病毒的高通量测序策略和方法本研究针对原始样本(来自临床或环境)与细胞培养产物样本(来自实验室)这两种不同类型的样本分别构建高通量测序策略与方法。首先,对于靶标病毒含量较高的细胞培养产物样本,本研究采用提取RNA并直接测序的策略,并利用MGISEQ-2000测序平台进行测序,针对该测序策略和测序平台开发相应的数据分析流程,获取其基因组序列;对于靶标病毒含量较低的原始样本,本研究借助Ampli Seq扩增技术进行目标样本扩增测序,并结合Ion Gene StudioS5 Plus测序平台进行序列测定,针对该测序策略和测序平台开发相应数据分析流程,获取其基因组序列。本研究中,选取了82个原始样本和183个细胞培养产物样本对建立的新冠病毒高通量测序方法和分析流程进行验证,共获得82个原始样本的新冠病毒序列,其中37个样本获得高质量基因组全长序列,以及183个细胞培养产物样本的高质量基因组全长序列。另外,本研究还针对新冠病毒检测中对检测时效的重要需求,对测序体系进行优化,在保证精准判定结果的前提下提升检测速度。(2)基于自然暴发疫情样本的新冠病毒进化动力学研究本研究以武汉和北京新发地市场早期疫情样本为对象,对新冠病毒在自然暴发和传播状态下的变异及进化规律进行了探索。2020年6月11日,北京地区在连续56天本地新增病例为0的情况下,以北京新发地市场为中心,再次发生疫情警报,引起了本地新一波疫情传播。本研究收集了82个新发地市场新冠患者的咽拭子样本和环境样本,利用本研究中针对原始样本的新冠病毒高通量测序方法获得了37个样本的高质量基因组全长序列,并对其进行单核苷酸多态性分析和系统发育分析。研究结果表明,北京新发地疫情新冠病毒基因组序列的共有突变位点与当时欧洲各地暴发流行的B.1.1谱系特有突变位点相重合,在进化树上二者聚集在同一个系统发育分支。由于武汉地区早期疫情的暴发与北京地区此次疫情均出现在批发市场,为探索其共性与差异,本研究采用比较基因组学和群体遗传学方法对两个地区疫情中新冠病毒的传播模式和进化动力学进行分析。系统发育分析结果表明,北京新发地地区的新冠病毒序列位于当时欧洲地区流行的B.1.1分支,与武汉地区序列位于不同的谱系分支,因此,判定北京新发地疫情为一起境外输入事件,其疫情传播源头来自欧洲地区。虽然二者位于不同谱系,但其传播模式存在相似性,均有一个较为密集的主要传播中心,但武汉地区传播范围更广,有多次传播的趋势;而北京地区二次传播迹象不明显,可能与北京地区疫情防控响应较为迅速,较快的阻止了疫情进一步扩大有关。另外,贝叶斯进化分析推测北京新发地疫情的祖先病毒在2020年5月初出现。与新冠病毒的平均进化速率相比,武汉地区和北京新发地地区等早期进化阶段的新冠病毒平均进化速率为8.073×10 subs/site/y