在DNA中存储数据听起来像科幻小说,但它是在不久的将来。Tom de Greef教授预计第一个DNA数据中心将在五到十年内启动并运行。数据不会以零和一的形式存储在硬盘驱动器中,而是存储在构成DNA的碱基对中:AT和CG。这样的数据中心将采用实验室的形式,比今天的小很多倍。
德格里夫已经可以想象这一切了。在建筑物的一部分,新文件将通过DNA合成进行编码。另一部分将包含大片胶囊,每个胶囊都装有一个文件。机械臂将取出胶囊,读取其内容物并将其放回原处。
【资料图】
我们谈论的是合成DNA。在实验室中,碱基以一定的顺序粘在一起,形成合成产生的DNA链。然后,可以将当前存储在数据中心中的文件和照片存储在DNA中。目前,该技术仅适用于存档存储。这是因为读取存储的数据非常昂贵,因此您希望尽可能少地查阅DNA文件。
耗能的大型数据中心已经过时
DNA中的数据存储具有许多优势。例如,DNA文件可以更紧凑地存储,并且数据的寿命也长很多倍。但也许最重要的是,这项新技术使大型、耗能的数据中心过时了。De Greef警告说,这是迫切需要的,“因为在三年内,我们将在全球范围内产生如此多的数据,以至于我们无法存储其中的一半。
De Greef与博士生Bas Bögels,微软和一群大学合作伙伴一起开发了一种新技术,使具有合成DNA的数据存储创新具有可扩展性。研究结果今天发表在《自然纳米技术》杂志上。De Greef在埃因霍温工业大学生物医学工程系和复杂分子系统研究所(ICMS)工作,并担任Radboud大学的客座教授。
可 伸缩
使用DNA链进行数据存储的想法出现在1980年代,但在当时太困难和昂贵了。三十年后,当DNA合成开始起飞时,这在技术上变得可行。 哈佛医学院的遗传学家乔治·丘奇(George Church)在2011年详细阐述了这个想法。从那时起,合成和数据读取变得指数级便宜,最终将该技术推向市场。
近年来,De Greef和他的团队主要研究读取存储的数据。目前,这是这项新技术面临的最大问题。目前用于此目的的PCR方法称为“随机访问”,非常容易出错。因此,您一次只能读取一个文件,此外,每次读取文件时,数据质量都会下降太多。不完全可扩展。
以下是它的工作原理:PCR(聚合酶链反应)通过添加具有所需DNA代码的引物来创建所需DNA片段的数百万个拷贝。例如,实验室中的电晕测试就是基于此:即使是来自鼻子的少量物质,在复制多次时也可以检测到。但是,如果要同时读取多个文件,则需要多个引物对同时完成其工作。这会在复制过程中产生许多错误。
每个胶囊包含一个文件
这就是胶囊发挥作用的地方。De Greef的小组开发了一种蛋白质和聚合物的微胶囊,然后为每个胶囊锚定一个文件。De Greef说:“这些胶囊具有热特性,我们可以利用这些特性来发挥自己的优势。在50摄氏度以上,胶囊自我密封,允许PCR过程在每个胶囊中单独进行。那么没有太多出错的余地。De Greef称之为“热约束PCR”。在实验室中,到目前为止,它已成功同时读取 25 个文件,没有出现重大错误。
如果随后再次降低温度,副本将从胶囊中分离,并且锚定的原始文件仍然存在,这意味着原始文件的质量不会下降。“我们目前在三次读取后损失了0.3%,而现有方法的损失为35%,”De Greef说。
可通过荧光搜索
这还不是全部。De Greef 还使数据库更易于搜索。每个文件都有一个荧光标签,每个胶囊都有自己的颜色。然后,设备可以识别颜色并将它们彼此分开。这让我们回到了这个故事开头的假想机器人手臂,它将在未来从胶囊池中整齐地选择所需的文件。
这解决了读取数据的问题。De Greef说:“现在只需要等到DNA合成的成本进一步下降。然后,该技术将准备好应用。因此,他希望荷兰能够很快开放其首个DNA数据中心 - 这是世界首创。