来自北卡罗来纳州立大学的研究人员对DNA数据存储系统产生了基本的新方法,使用户能够在不破坏它们的情况下读取或修改数据文件,并使系统更容易扩展以进行实际使用。
“大多数现有的DNA数据存储系统依赖于聚合酶链反应(PCR)来访问存储的文件,这在复制信息时非常有效,但提出了一些重大挑战,”Albert Keung,关于工作的一篇论文的共同对应作者表示了一些重大挑战。“我们开发了一个称为动态操作和可重用信息存储或Doris的系统,不依赖于PCR。这有助于我们解决了DNA数据存储技术实际实施的一些关键障碍。“Keung是NC状态的化学和生物分子工程助理教授。
DNA数据存储系统具有比现有的可比大小的现有系统更高的信息达到数量级。然而,现有技术努力解决与实际实施有关的一系列疑虑。
电流系统依赖于称为引物结合序列的DNA序列,所述序列被添加到存储信息的DNA链的末端。简而言之,DNA的引物结合序列用作文件名。当您想要给定文件时,可以检索轴承该序列的DNA链。
DNA数据存储技术的许多实际障碍围绕使用PCR来检索存储的数据。依赖于PCR的系统必须大大提高和降低储存遗传物质的温度,以便分开双链DNA并露出引物结合序列。这导致所有DNA - 引物结合序列和数据储存序列 - 在一种遗传汤中免费游泳。然后,现有技术可以通过汤来查找,检索和复制相关的DNA使用PCR。对于开发实用技术,温度摇摆是有问题的,并且PCR技术本身逐渐消耗 - 或者使用 - 正在检索的文件的原始版本。
多士采取不同的方法。Doris代替使用双链DNA作为引物结合序列,使用由单链DNA的“突出”,如尾部,该尾巴在实际存储数据的双链DNA后面。虽然传统技术所需的温度波动撕裂,以便使用单链悬垂的相关引物结合序列来找到相关的引物结合序列,这意味着Doris可以在不扰乱双链DNA的情况下找到合适的引物结合序列。
“换句话说,Doris可以在室温下工作,使得在现实世界方案中开发可行的DNA数据管理技术更加可行,”詹姆斯·塔克,本文的合作作者和电气教授NC状态的计算机工程。
不必撕裂DNA链的另一个益处是悬伸中的DNA序列可以与数据文件本身的双链区域中发现的序列相同。这难以在基于PCR的系统中实现而不牺牲信息密度 - 因为系统将无法区分引物结合序列和数据存储序列。
“Doris允许我们显着提高系统的信息密度,并且还可以更容易地扩展以处理真正的大型数据库,”纸张的第一个作者和博士学位,凯文林说。在NC状态的学生。
一旦Doris鉴定了正确的DNA序列,它就不依赖于PCR来制作副本。相反,Doris将DNA转录到RNA,然后将其反转回转为数据存储系统可以读取的DNA。换句话说,Doris不必使用原始文件才能读取它。
也可以修改单链悬垂,允许用户重命名文件,删除文件或“锁定”它们 - 有效地使它们对其他用户不可见。
“我们已经开发了一个多丽丝的功能原型,所以我们知道它有效,”Keung说。“我们现在对缩放缩放感兴趣,加速它并将其放入一个自动化流程的设备 - 使其友好。”
本文将在今天(6月12日)在“自然通信”期刊上发表于今天(6月12日)发布的“动态和可扩展的DNA的信息存储”。该文件由博士博士,博士牛克尔克尔撰写。在NC状态的学生。
参考:Kevin N. Lin,Kevin Volkel,James M. Tuck和Albert J. Keung,2020年6月12日,Nature Communications.doi:
10.1038 / s41467-020-16797-2
该工作是通过国家科学基金会的支持,根据授权CNS-1650148和CNS-1901324支持;北卡罗来纳州立大学研究与创新种子融资奖;北卡罗来纳州生物技术中心闪存赠款;和在需要团契的领域援助的教育部毕业。