0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工合成 DNA存储,液体转移DNA成难点

电子工程师 来源:YXQ 2019-04-07 09:22 次阅读

现代存储技术已经无法满足字节的海啸式增长,但是大自然也许已为这个难题提供了解决方案。

比如,DNA。

上个月,来自微软和华盛顿大学的研究人员宣布:以人工合成为DNA为载体的存储和读取数据的全自动系统研制成功,迈出了该技术从研究实验室走进商业应用关键的一步。

在一次概念验证测试中,该研究团队成功地在人工合成的DNA片段中编码了“hello”一词,并使用全自动端到端系统将其转换回数字数据。

其实早在2016年7月,微软和华盛顿大学的研究人员就已经宣布,利用DNA存储技术完成了约200MB数据的保存,相对于当时最大存储为739KB的EBI文件来说已经实现了信息存储了飞跃。

该研究声称,如果信息封装密度像大肠杆菌的基因那么高,全世界的存储需求可用1千克的DNA来满足。

这一结果发布在当年9月份的《自然(Nature)》杂志上。

两年多的时间过去了,微软和华盛顿大学的研究人员又取得了新突破:不仅存储量翻了5倍——能够在DNA中存储1000MB的数据,还实现了从存储到提取信息的重大突破。也就是说,用DNA存储数据已经成为可能。

该研究结果发表在一篇名为《DNA自动存储端到端自动化演示》的论文中,并于3月21日出版在Nature Scientific Reports版块。

人工合成DNA存储

DNA存储数字信息的空间比目前建造的数据中心要小好几个数量级。我们每天都在产生海量数据,从商业信息到可爱的动物视频再到医学扫描图像和外太空图像,因此DNA非常适合用来存储大规模的数据。

微软首席研究员Karin Strauss称:“我们的最终目标是将一个全自动系统投入到实际应用。对终端用户来说,这类似于云端存储服务——将数据上传到数据中心并存储在那里,用户随时可以查看并下载云端数据。要做到这一点,我们首先需要从自动化角度证明这是可用的。”

华盛顿大学的高级研究科学家Chris Takahashi说:“信息存储在人工合成的DNA分子中(而不是人类或其它生物的DNA分子),并且可以在发送到系统之前进行加密。 虽然这个过程的关键部分可以由DNA合成器和DNA测序仪等机器完成,但到目前为止,许多中间步骤都需要在研究实验室中进行人工操作,这在实际应用中是很难实现。”

“总不能让一群人带着移液器(一种用于定量转移液体的小型器具)在数据中心里四处奔跑,而且移液器在使用过程中容易出现人为错误,成本也很高。”

从信息存储商业化的角度来看,人们需要降低合成DNA的成本,包括合成存储信息的DNA双链和提取信息的DNA测序。

自动化是DNA存储商用关键

微软的研究人员说,自动化是另一个关键因素,因为它可以实现商业级规模的存储并极大降低成本。

现有的存档技术在几十年内将不再适用,而DNA存储信息的时间要比它长得多。比如说:DNA可以在猛犸象牙和原始人骨骼中存在数万年。

值得强调的是,这还不是理想的储存条件。DNA包含的遗传密码是通用的,也就是说自然界所有生物共用同一套遗传密码,基于此,理论上来说人类可以解读所有生物的遗传信息。

DNA是由四个碱基:腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鸟嘌呤(G)构建而成的。微软和华盛顿大学联合开发了一套DNA数据自动存储系统,将数字数据的1和0转换为构成DNA的A、T、C和G,然后将其它必要反应液注入合成器,合成器就能合成DNA片段并将其推入储存器。

将1和0 转换成DNA的A、T、C、G

当系统需要检索信息时,它会添加其它化学物质来提取所需的DNA,并使用微流体泵将液体推入系统的其它部分。接着“读取”DNA序列并将其转换回计算机可以理解的信息。

研究人员表示,研究项目的目标不是要证明系统能够以多快的速度或多低的成本运作,而只是为了证明自动化是可行的。

DNA自动化存储系统的一个直接好处是,它可以让研究人员从繁复的实验中挣脱出来,去解决更深层次的问题。

微软研究员Bichlien Nguyen说:“自动化系统能进行重复性的工作,这使得人们能够从更宏观的角度制定新策略,从根本上进行更快的创新。”

分子信息系统实验室的团队已经证明DNA可以存储宠物照片,文学作品,流行视频和档案信息,并且在检索数据的过程中不出错。

研究人员还开发了一些技术来执行很有意义的计算任务——比如只搜索包含苹果或绿色自行车的图像,使用的是DNA分子本身,而不必将文件转换回数字格式。

华盛顿大学的Luis Ceze教授说:“我们肯定会看到一种新型计算机系统的诞生,人们可以使用DNA分子存储数据,用电子设备进行控制和处理。将DNA和计算机结合到一起为未来提供了无限的可能。”

人类的DNA存储探索

人类对DNA数据存储能力的探索早已有之。

1988年,艺术家乔•戴维斯与哈佛的学者合作,第一个将数字信号0和1对应到DNA的四个碱基。他们把DNA序列插入到大肠杆菌里,仅仅编码了35个字节。当排列成一个5*7的矩阵时,1对应到暗像素,0对应到亮像素,它们组成了一幅古代日耳曼如尼字母图画,代表生命和女性的地球。

现在戴维斯已经加入了丘奇的实验室,该实验室2011年起开始探索DNA数据存储。哈佛团队希望该应用可以减少合成DNA的高成本,就像基因组学的测序成本已经降低了许多。丘奇与加州大学洛杉矶分校的瑟里• 库苏里(Sri Kosuri)以及约翰•霍普金斯大学的基因组专家高原(Yuan Gao)于2011年11月实施了概念证明性实验。

他们的团队使用了很多短DNA片段编码了一本丘奇与他人合写的659KB数据的书。每个片段的一部分用来进行排序后片段组装顺序,剩余部分用于编码数据。将数据保存在DNA之中需要将二进制0和1数据转换为4种核苷酸,其中0用腺苷酸或胞嘧啶来编码,而1则用鸟苷酸或胸腺嘧啶。

这种灵活性帮助团队设计序列,避免测序中高GC区读取错误、重复序列或发卡结构导致的绑定彼此的片段发生序列折叠。他们没有做严谨的纠错,而是依靠每个片段拥有多个拷贝的信息冗余。结果对片段测序后,他们发现了22个错误,大大高于可靠存储的要求。

同时在EBI,高德曼、伯尼和他们的同事也在使用很多DNA片段来编码一个739KB的数据存储,包含一个图片、ASCII文本、声音文件和一个PDF版的华生和克里克标志性的双螺旋结构。为了避免重复碱基和其他来源的错误,EBI领导的这个团队使用了一个更加复杂的系统(见“制作存储体”)。

一方面是将0和1组成的二进制数据编码修改成以3个数为基础,即0,1和2,然后持续地轮换使用每一个数的代表,因此而避免在读取数据时序列可能出现的问题。通过利用序列重叠,100个碱基长度的片段持续位移25个碱基,EBI的科学家们确保有4个版本的片段来做错误检查和互相比较。

液体转移DNA难点

与基于硅的计算系统不同,基于DNA的存储和计算系统必须使用液体来转移DNA分子。流体本质上与电子不同,这意味着我们需要全新的技术解决方案。

华盛顿大学的团队与微软正在合作开发一种可编程系统,利用电和水的特性在电极网格上移动水滴,从而实现实验自动化。名为“Puddle”和“PurpleDrop”的一整套软件和硬件可以混合、分离、加热或冷却不同的液体并按标准实验步骤进行实验。

MISL团队下一步要做的是将简单的端到端自动化系统与PurpleDrop等技术以及能够使用DNA分子进行搜索的技术相结合。研究人员专门设计了模块化的自动化系统,使其能够随着新的DNA技术的出现而发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7484

    浏览量

    163763
  • DNA
    DNA
    +关注

    关注

    0

    文章

    243

    浏览量

    31026

原文标题:让DNA说Hello!微软成功研制用DNA存储读取数据的全自动系统

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    DNA计算机研究取得突破性进展:PB级数据存储与高效处理

    8月29日,科学界传来振奋人心的消息,一项革命性的研究成果为实现全功能DNA计算机奠定了坚实基础。研究团队成功开发出一种创新技术,该技术不仅能在DNA存储惊人的PB级数据,还能确保这些数据在数千乃至数百万年内保持完好,同时实现
    的头像 发表于 08-29 16:29 499次阅读

    人工神经元模型中常见的转移函数有哪些

    人工神经元模型是神经网络的基础,它模拟了生物神经元的工作原理。在人工神经元模型中,转移函数起着至关重要的作用,它决定了神经元的输出。以下是一些常见的转移函数: 线性函数 :这是最简单的
    的头像 发表于 07-11 11:22 1059次阅读

    用于DNA信息存储和新冠病毒检测的生物分子封装新策略

    生物分子的封装和可控释放在生物基信息存储、生物传感、医学鉴定、药物递送等领域具有重要应用价值。
    的头像 发表于 05-27 10:46 652次阅读
    用于<b class='flag-5'>DNA</b>信息<b class='flag-5'>存储</b>和新冠病毒检测的生物分子封装新策略

    基于微流控技术的DNA甲基化分析方法研究进展综述

    近年来,大量研究致力于开发DNA甲基化检测方法。检测方法的进步可以促进DNA甲基化在临床医学和科学研究方面的应用。
    的头像 发表于 05-21 09:08 826次阅读
    基于微流控技术的<b class='flag-5'>DNA</b>甲基化分析方法研究进展综述

    基于熵驱动链置换策略的高灵敏mRNA检测与细胞内成像研究

    信使RNA(Messenger RNA,mRNA)是一类由DNA作为模版转录而来的携带有遗传信息的单链核糖核酸,作用是指导蛋白质的合成
    的头像 发表于 05-08 09:08 559次阅读
    基于熵驱动链置换策略的高灵敏mRNA检测与细胞内成像研究

    功能化DNA水凝胶在生物传感领域的应用研究进展综述

    DNA水凝胶是由DNA交联聚合物骨架或纯DNA模块自组装形成的亲水性聚合物网络。
    的头像 发表于 04-20 11:44 1387次阅读
    功能化<b class='flag-5'>DNA</b>水凝胶在生物传感领域的应用研究进展综述

    用于增强微生物物种间DNA转移的新型液滴微流控平台设计

    利用各种合成生物学工具和方法进行微生物工程已经取得了重大进展。
    的头像 发表于 03-17 10:41 969次阅读
    用于增强微生物物种间<b class='flag-5'>DNA</b><b class='flag-5'>转移</b>的新型液滴微流控平台设计

    电感耦合等离子体质谱+DNA纳米机器人用于HPV病毒的高效检测

    ,以及信号背景低等优势,与金属稳定同位素标记结合对生物分子进行分析被认为是一种极具潜力的策略。 近日,四川大学吕弋教授带领研究团队结合CRISPR-Cas12a和DNA纳米机器人,利用金属稳定
    的头像 发表于 02-22 09:10 1763次阅读
    电感耦合等离子体质谱+<b class='flag-5'>DNA</b>纳米机器人用于HPV病毒的高效检测

    高通量测序技术及原理介绍

    高通量测序技术是生物学领域中一种重要的分析工具,它可以快速、准确地测定DNA序列或RNA序列。高通量测序技术的出现,极大地促进了基因组学、转录组学以及生物信息学等领域的发展。本文将从高通量测序技术
    的头像 发表于 02-03 14:46 1.2w次阅读

    深度学习破解DNA数据复制难题

    在RNA转录中,知道何时停止是至关重要的。编码RNA的信息在整个细胞中用于合成蛋白质和调节广泛的代谢过程。要想将正确的信息传递给预期的目标,需要这些RNA链尽可能多地表达——仅此而已。
    的头像 发表于 01-25 16:35 699次阅读

    基于离子浓度极化的微流控平台用于ctDNA的高灵敏度检测

    循环肿瘤DNA(circulating-tumor DNA,ctDNA)是指人体血液中肿瘤细胞体细胞DNA经脱落或者当细胞凋亡后释放进入循环系统,其中包含着癌症早期诊断和预后监测等重要信息
    的头像 发表于 01-23 10:36 628次阅读
    基于离子浓度极化的微流控平台用于ctDNA的高灵敏度检测

    DNA存储卡:高价与遥远现实

    生物记忆表示,其 DNA 存储卡有望保证 150 年内的数据存储安全,远远超出人类生存年限。然而,对于多数消费者而言,花费如此高价仅换来 1KB 数据容量实属非商业化选择。
    的头像 发表于 01-23 10:29 617次阅读

    全球首款DNA存储卡面世:存储1KB数据售价1000欧元

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2024年01月22日 13:39:08

    特色应用:TriVista在生命科学领域的应用

      今天介绍的应用是基于来意大利的一组物理学家和化学家发表的一篇新论文。该论文使用CERIC‐ERIC合金用于研究DNA构象稳定性。该项目是关于离子液体作为新一代溶剂稳定DNA双螺旋结构的研究
    的头像 发表于 01-09 06:32 290次阅读
    特色应用:TriVista在生命科学领域的应用

    读取Xilinx FPGA芯片设备标识符的方法-DNA

    每一片芯片内部存有一个设备标识符,xilinx把它叫做DNA,这个DNA是不可更改的,永久存在芯片里面的。
    的头像 发表于 01-03 09:19 3899次阅读
    读取Xilinx FPGA芯片设备标识符的方法-<b class='flag-5'>DNA</b>