关键词:
大肠杆菌表达系统
基因组注释
底盘细胞改造
可溶性表达
摘要:
近年来,基于高通量测序技术、基因编辑等生物技术的快速发展为重组蛋白、基因工程疫苗以及诊断试剂等生物药物研发开辟新的道路。大肠杆菌(Escherichia coli,***)表达系统以其生长速度快、遗传背景清楚、易于培养和生产成本低等优势广泛应用于重组蛋白、工业酶类以及基因工程疫苗生产等,全球每年利用大肠杆菌表达系统生产的生物药物产值已高达数千亿人民币。然而,大肠杆菌表达系统仍存在内毒素残留、外源蛋白泄露表达、高效诱导外源蛋白表达易形成包涵体和连续培养时质粒易丢失等缺陷,大肠杆菌是如何调控外源蛋白的表达,如何进行高效合成蛋白的大肠杆菌底盘细胞改造,是这一领域的核心科学问题,这些研究对于合成生物学以及生物医药产业具有重要的意义。高通量测序和多维度组学技术的发展,加速了人们对大肠杆菌的遗传学理解和作为底盘细胞的性能改造,已经发现多种方式可以促进外源蛋白的表达,比如低温诱导或控制比生长速率等,但其所涉及的相关生物过程及机制仍未阐明。本研究利用高通量测序、生物信息学分析以及基因编辑技术对大肠杆菌ER2566底盘细胞进行分析与改造,构建具有促可溶表达、低内毒素和整合表达等特性的大肠杆菌底盘细胞。首先,通过优化样本提取、文库构建、数据分析等流程,可获得高质量单端测序(200-500 bp)数据,建立了 Ion Torrent高通量测序平台。完成了用于生产重组戊肝疫苗和HPV疫苗的大肠杆菌ER2566的全基因组重测序,通过微生物短片段基因组组装策略拼接了完整ER2566基因组序列,并提出了多软件交叉组合基因组注释的新流程,结合人工校正进行大肠杆菌ER2566基因组的重注释,相比于已发表的原始注释信息共删除190个假想基因及假基因,新增加了 237个编码基因,230个ncRNA以及2个tRNAs,同时完善注释基因的名称,功能等信息,从而,更新了 ER2566菌株基因组的重注释信息。为了提高目前微生物基因组注释软件的注释效率和数据库中菌株基因组注释的信息完整度,并为广大研究者提供自动注释的软件平台,本研究将上述基因组注释流程利用Python编辑语言编写微生物注释软件PGGZ,经与多种常用注释软件(DFAST,NCBI,RAST)分析比较,该软件可快速、准确、高效完成基因组微生物重注释并且注释基因特征更丰富、处理数据能力更强。为了进一步推广并优化该注释流程的使用,我们采用Django框架,Nginx服务器以及Postgresql数据库等完成大肠杆菌基因组注释网站的开发(https://***),研究者通过将需注释大肠杆菌基因组信息提交到开放的服务器上,即可在15分钟左右获得完整基因组注释信息,其中的基因功能模块信息,为研究生命体高度动态、复杂调控过程机制、构建高版本底盘细胞提供理论依据。其次,为探索大肠杆菌底盘细胞在面对低温诱导的促重组蛋白可溶性表达及外源蛋白泄露表达时的转录响应机制,本研究共设计ER2566底盘细胞不含重组质粒(B37),含有重组质粒不诱导(N37),以及含有外源重组质粒24℃诱导(Y24),37℃诱导(Y37)条件下的四组转录本测序及分析,通过主成分分析及荧光定量PCR等方式鉴定转录组数据具有良好测序质量、组间可重复性及一致性。分析比较Y24与Y37样品组探究低温诱导对宿主菌株代谢情况影响,从GO以及KEGG富集分析结果表明低温诱导促进细胞运动,多糖运输,多糖定位,麦芽糖糊精运输,鞭毛合成,细胞定位,麦芽糖运输相关通路上调表达,而与氧化还原过程、有机化合物氧化能量导出、细胞呼吸、厌氧呼吸和碳水化合物跨膜运输相关通路则显著下调,降低了细胞能量等相关代谢。进一步分析比较N37与B37样品组探究无诱导条件下外源蛋白泄露表达时宿主转录响应过程,其中铜离子去毒素,铜离子胁迫相应,核糖体组装以及蛋白质转运等生物过程显著下调。然而,芳香族化合物生物合成,RNA代谢,代谢调节以及海藻糖代谢等生物过程显著上调,细胞主要集中于生物代谢过程。这些结果初步揭示了大肠杆菌底盘细胞的代谢与调控网络,以及细胞能量与物质代谢过程,为构建高版本底盘细胞奠定了基础。最后,提出了一种新型的基于组学数据的底盘细胞改造策略,综合富集分析以及高表达差异基因数据,筛选并鉴定18个下调差异基因以及17个上调差异基因作为基因编辑的靶基因。随后,利用λ-Red同源重组技术对35个差异基因进行敲除验证和构建基因组改造菌株。其中ER2566-ΔbluF,ΔcdyA,ΔmngR以及Δudp等基因敲除菌株后显著降低外源蛋白可溶性表达,在24℃以及37℃诱导表达时外源蛋白可溶性表达量下降40%-70%。而ER2566-ΔflgH、ΔflgK和ΔflgL基因敲除可增加20%左右的外源蛋白可溶性表达量。进一步组合多种不同上调差异基因构建组合改造菌株ER256