关键词:
DNA存储
电化学
DNA合成
DNA测序
滑动芯片
引物交换反应
DNA计算
摘要:
随着信息技术的不断发展,信息传播的速度不断加快,随之而来的是信息总产生量的指数式增长。据估计,在未来二十年内传统信息存储媒介(如硬盘、磁带、光盘、闪存等)将不足以承载巨大的信息产生量,而目前大型数据中心存在建造成本高、电力能耗高、碳排放量大、存储寿命短、需要技术人员定期维护等诸多问题。因此,亟需发展一种具有高存储容量、长保存时间、低能耗等特征的新型存储介质。脱氧核糖核酸(Deoxyribonucleic acid,DNA)是生物体内广泛存在的信息载体,其具有极高的信息存储密度和极长的保存时间等特性,引起了人们的关注和重视,基于DNA的分子存储被认为是应对未来数据危机的一个潜在方案,可用于档案、历史资料等获取频率较低的冷数据的存储。DNA存储流程主要包括编码、DNA合成、文库保存、DNA测序、解码等步骤,但目前的流程中尚存在许多问题没有解决。第一,受DNA合成技术的限制,目前DNA分子的高通量从头合成费用高,效率低,错误多,合成周期长,导致现阶段的DNA存储系统受到存储成本、存储周期等诸多因素的制约,仍然难以迈向实际应用;第二,目前的DNA合成、测序过程往往涉及到复杂繁琐的人工操作以及大型合成、测序设备的使用,并没有根据DNA存储这一应用的流程进行优化。因此,针对DNA存储流程的特征,设计具有简单高效、高度集成化、灵活可变等特点的DNA存储系统对于突破目前应用瓶颈,推动DNA存储走向实用化而言十分必要。本文基于电化学、微流控及分子生物学等技术方法,首先对DNA的电化学合成与生物合成方法进行了探索和尝试,对合成效率、准确度、反应灵活性等指标进行表征与优化,以解决目前DNA存储系统存储成本高,周期长等问题;随后,通过探索电极上DNA原位测序方法,结合微纳加工工艺和微流控滑动芯片技术,设计了可扩展的集成化DNA存储系统,可在单电极上先后完成DNA合成与测序过程,简化数据读写步骤,解决目前DNA存储系统流程不连贯,各流程兼容性差的问题。主要研究内容如下:1.探索了DNA电化学合成方法,通过表面功能化修饰提高电极表面DNA合成的密度和准确度。利用基于亚磷酰胺的化学合成方法,结合电化学脱保护方法在金电极表面合成DNA分子。通过荧光原位杂交和计时库伦法等方法,表征电极表面合成的DNA分子的序列准确度和表面密度(4.1*10个分子/cm),并利用其进一步优化合成步骤中的参数,实现电极上的DNA高效合成,产率达97.1%。2.探索了DNA生物酶合成方法,利用引物交换反应,构建了可编辑的、可重复使用的模块化DNA存储系统。引物交换反应以DNA发卡为模板,在DNA聚合酶的催化下在引物末端延伸DNA序列,从而实现信息写入。该系统的存储原理与活字印刷原理类似,即复制最小信息单元的信息并将其组装成新的信息。本实验实现了图片、文本、随机数等多种信息种类的合成和组装。这种模块化、可重复使用的设计减少了DNA从头合成的比例,节省了合成费用(880 US$MB)和时间,同时具有高合成长度(680 nt)和低错误率的优点(约1%)。该系统可与DNA计算结合,通过自主运算实现特定信息的合成,为构建可编程的智能DNA存储系统提供了新的思路。3.利用微流控滑动芯片技术将DNA合成与测序流程整合,构建了可扩展的集成化DNA存储系统。首先,利用电荷振荡原理,测量DNA双链在延伸中产生的电流信号,实现了电极上的DNA测序,测序准确率约为84.1%;并通过化学变性,实现了DNA分子的重复测序,进一步提高测序准确度至93.3%。随后,使用微流控滑动芯片技术在2*2电极阵列上实现了不同序列的DNA合成与原位测序,将数据读写过程耦合,减少了流体输送设备以及DNA合成仪、测序仪等大型仪器的使用,并缩短了DNA存储系统的整体流程,实现了47字节数据的存储。该工作提出了一种集成化DNA存储系统的设计原型,为未来构建可扩展、高通量、自动化的DNA存储系统提供了理论参考。