0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存储新图谱:DNA存储的边界与天地

脑极体 来源:脑极体 作者:脑极体 2022-02-23 09:00 次阅读

数字信息时代,无论是生产数据的各大视频网站、应用平台等,还是消费者们使用的各类电子设备,都无不在时时刻刻产生数据。

自动驾驶举例来说,平均每辆自动驾驶车每天产生的数据量高达10TB。根据IDC机构的预测,2020年到2025年间,全球生成的数据(包括新数据和副本数据)量预计复合年增长率为23%,到2025年达到180ZB,每天几乎产生490EB的数据。

数据也成为继土地、劳动力、资本、技术之后的第五种生产要素,所有基于数据的挖掘和增值都离不开存储。存储成为数据应用的基础,其存储方式也随着数据量的激增与需求不断发生变化。在信息与技术的不断发展演进中,存储开始面临不少的挑战。

存储设备、介质(磁性材料和半导体材料)随时间的老化与更新不及时,存储维护成本高,存储密度的局限以及能源功耗大等。这些现实的困境驱动业界开始寻找更好的替代方案,满足不断增高的性能、低功耗、稳定性等需求。

DNA存储成为基础的新存储技术被作为优先的研究方向,以解决数据存储中存在的负荷与问题。我们经常会在新闻中看到,考古学家通过什么DNA测定,了解到几百年、几千年的信息。据悉,在合适的条件下,DNA可以持续存在数十万年,甚至几百万年。

不考虑DNA的其他存储特性,仅仅凭借着恒久的保存时间,我们的数据也有可能成为和“化石”一样的存在,这个特性就十分值得我们长久地下功夫去研究与投资。当然,DNA存储的优势不止如此。

存储效率的千倍提升

DNA存储简单来说,原理就是将DNA分子中的碱基序列与存储信息编码一一对应,将文字、图片、声音等信息转化为DNA序列进行存储。这是一门需要多学科交叉的高精尖技术,涉及生物、计算机、化学等学科。

在生物分子中储存信息,非常复杂。科学家们将目光与精力投入到DNA存储的领域,最根本的原因是看重其极高的存储密度特性。据悉,1克DNA即可储存215PB的信息,而硬盘的存储量不过几TB。要知道,1PB=1024TB=1024X1024GB,按照高清电影每部10GB算,1克DNA能够存储2.2亿部电影。与此同时DNA存储的维护成本也相较数据中心低很多。在能耗方面,1GB的数据硬盘存储能耗约为0.04W,而DNA存储的能耗则远远小于硬盘存储能耗,可忽略不计。

在数据量日渐激增的信息时代,高存储密度,低成本维护与低能耗储存信息的方式,使得科研机构与资本都将精力与金钱押码在这个可能成为未来主流存储方式。不过虽然有资金与科研的投入,但其进展仍较为缓慢。我们能在公开渠道中看到的成果都是实验室的最佳成绩。例如2012年,哈佛大学研究人员用DNA储存了一本五万字的图书。欧洲生物信息研究所在DNA储存了莎士比亚的十四行诗以及马丁·路德·金的演讲《我有一个梦想》的录音带。

从上世纪50年代提出,DNA的数据存储研究的进展一直缓慢,没有什么较为重大的变化。不过在近两年,DNA存储的技术开始有了一些新的进展。近日微软研究院对外宣称,研究出新的分子控制器,使得DNA的存储写入的速度相较以往提高了1000倍。微软研究院作为DNA数据存储的早期入局者,2015年开始进行相关研究,直到2019年才有研发进展,到如今速率千倍的升级,还是着实下了一番功夫。

与此同时,国内的东南大学生物科学与医学工程的刘宏团队也实现了DNA存储的新突破:立足自主开发实现了DNA合成与测序环节的一体化,仪器设备也实现了小型化。DNA存储在国外的技术路线大都是存储的合成与测序环节分开进行,需要大型的仪器设备,操作也相对复杂一些。刘宏团队将仪器设备等朝着便携式改进了许多。

佐治亚理工学院(GTRI)近期也公布了新进展,他们的团队设计了一种微芯片,可以显著提高以DNA形式写入数据的速度。该团队预计将比当前的DNA存储技术提高100倍。

研究机构的各种进展也使得嗅觉灵敏的投资机构风闻而来,中科碳元(深圳)、密码子(杭州)等创业公司获得数千万的天使轮融资。

而政策方面,DNA存储已经成为国家层面部署的重点发展方向。国家“十四五”规划中提到要加快布局量子计算、量子通讯、神经芯片、DNA存储等前沿技术。我们可以看到,DNA存储在政策、资本与技术的集中发力中开始蓄势待发,不过对于这类高精尖的技术来说,距离其真正的商业化落地进程还尚早。

难以突破的结构性障碍

虽然DNA存储具有较为明显突出的优势,政策、资本等也在全方位的支持,应用的前景广阔,但商业化的进展仍然十分缓慢。其最大屏障来自于其存储技术本身。

为了便于理解DNA存储的面临的技术困境,我们简单介绍一下DNA存储数据的过程。主要分为以下五个步骤:编码——将数字信息编码为DNA序列;合成——将序列融入实际的DNA分子;存储——将合成的DNA片段保存在载体或细胞中;访问——检索和选择性读取序列信息;解码——将测定的序列信息转换回数字信息。

在整个存储的过程中,编码与合成是DNA存储中较为关键和困难的环节。尤其是DNA的合成过程最为艰辛,在碱基序列融入DNA分子的过程中,很容易随机损失掉合成的DNA。

而编码是DNA存储中成本与难度较大的环节,不过随着AI、纳米微孔等技术的发展,编码环节的难度与成本都开始逐渐降低。

DNA存储的合成过程使得数据输入和读取的效率无法提上去,花费的时间较长、成本较高。据佐治亚理工学院2021年12月披露的信息称,DNA存储速度提升到了每天写入20GB数据,这是目前已知DNA存储最快的写入速度,而目前固态硬盘的读写速度最快大约为每秒500MB。

成本方面,2017年哥伦比亚大学的实验显示,合成2MB的DNA数据需要7000美元,而读取数据需要2000美元,如果用户需要以DNA形式储存1GB的电影,编码大约需要花费358万美元,而读取数据还需要102万美元。DNA存储技术的读写速度与成本,大大制约了其规模商业化的发展。

另外一个较大的影响因素跟科研人才相关,由于DNA存储技术领域的强学科交叉性,必须依靠计算机、生物、化学、数学等多个相关学科的协同,这也就对科研人才的复合能力水平要求较高。

当然除了技术的进阶、人才的需求以外,存储的便携式要求也是其较为重要的发展方向需求。对于这类高精尖技术的设备,传统的设备都较为笨重,便携式的优化也困难重重。总的来说,DNA存储的各个环节都有较多的难关需要克服,DNA存储真正意义上的走入商业市场,进一步发展成为主流的存储设备,还需要长时间的沉淀,才能让DNA存储技术有实质的进阶。

终极存储:深空与亘古

对于数据的存储来说,多元化、智能化、绿色化是其主要的发展风向标,尤其是绿色的数据中心是主推的发展方向。

据研究机构预测,若能源利用效率得不到持续提高,数据存储用电量到2030年可能增长到全球用电总量的3%至13%。数据存储的能源功耗令人担忧,降低能耗将成为数据中心建设的首要目标,存储设备作为数据中心中最为耗能的设备,成为革新的排头兵。

目前改进常见的思路是从存储设备的硬件层面进行考量,如架构设计、芯片、硬盘介质等。而DNA存储可谓是存储的终极进化方向。据悉,麻省理工学院生物工程教授MarkBathe称,理论上,一个装满DNA的咖啡杯就可以存储世界上所有的数据。如果未来可以实现,DNA存储一定会革新存储领域的格局。

在生物科技领域,近年来因为人工智能技术的飞速发展,一些生物科技和人工智能交融的方面,例如蛋白质的结构预测、新药的研发、制备都有了质的飞跃。DNA存储在AI技术的加持下,其编码的环节效率也获得了极大地提升。未来随着纳米技术与AI技术的加持,DNA存储的技术也会一步步解除智识的限制禁锢,逐步升级,为存储领域带来质的飞跃。

当然DNA存储除了数据的存储外,也有一些新应用方向的可能。比如,可以把个人健康历史数据存储进DNA,这种存储方法与人体更兼容,医生可以随时的调用参考这些病例数据,更加精准全面地进行治疗,改善病患的健康情况,甚至促进寿命的增加。

未来人类深空宇航飞行的时候,可以用DNA存储信息,只要制备适宜的保存条件,这些讯息就会留存,向宇宙深处传播;也可能存在这种情形,新人类在考古的时候,发掘出我们存储在DNA的彩蛋,DNA的数据展开是一部先辈留存的文明与技术讯息,诉说着我们的辉煌与经验,感觉有种终极的浪漫。我们最后要留下什么传承,如何实现这个技术,这个终极的存储进化值得我们去研究与等待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 硬盘
    +关注

    关注

    3

    文章

    1292

    浏览量

    57240
  • 存储
    +关注

    关注

    13

    文章

    4265

    浏览量

    85677
  • 人工智能
    +关注

    关注

    1791

    文章

    46882

    浏览量

    237623
  • DNA
    DNA
    +关注

    关注

    0

    文章

    243

    浏览量

    30983
  • 自动驾驶
    +关注

    关注

    783

    文章

    13690

    浏览量

    166161
收藏 人收藏

    评论

    相关推荐

    如何优化emc存储性能

    在当今的数据中心环境中,存储性能对于业务连续性和数据访问速度至关重要。EMC作为领先的存储解决方案提供商,其产品线涵盖了从入门级到企业级的存储系统。然而,即使是最好的存储系统也需要定期
    的头像 发表于 11-01 15:57 209次阅读

    oss对象存储费用是多少一年?#费用 #对象存储

    存储
    jf_57681485
    发布于 :2024年10月15日 15:38:19

    存储器主要用来存储什么

    存储器(内部存储器)是计算机硬件的重要组成部分,它直接与中央处理器(CPU)相连,用于存储正在运行的程序和当前处理的数据。内存储器的容量、速度和类型对计算机的整体性能有着直接的影响。
    的头像 发表于 10-14 09:55 444次阅读

    存储器分为随机存储器和什么

    存储器是计算机系统中用于临时存储数据和程序的关键部件,它直接影响到计算机的运行速度和性能。内存储器主要分为两大类:随机存储器(RAM,Random Access Memory)和只读
    的头像 发表于 10-14 09:54 637次阅读

    DNA计算机研究取得突破性进展:PB级数据存储与高效处理

    8月29日,科学界传来振奋人心的消息,一项革命性的研究成果为实现全功能DNA计算机奠定了坚实基础。研究团队成功开发出一种创新技术,该技术不仅能在DNA存储惊人的PB级数据,还能确保这些数据在数千乃至数百万年内保持完好,同时实现
    的头像 发表于 08-29 16:29 457次阅读

    ram存储器和rom存储器的区别是什么

    定义: RAM(Random Access Memory):随机存取存储器,是一种易失性存储器,主要用于计算机和其他设备的临时存储。 ROM(Read-Only Memory):只读存储
    的头像 发表于 08-06 09:17 579次阅读

    eeprom存储原理、存储结构及读写操作

    EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)是一种非易失性存储器,可以在不移除电源的情况下进行读写
    的头像 发表于 08-05 17:03 2016次阅读

    存储,也能性价比+性能双优?

    存储
    脑极体
    发布于 :2024年05月07日 15:07:36

    存储芯片是什么样存储信息的

    存储信息时,对于动态存储器,行地址首先将RAS锁存于芯片中,然后列地址将CAS锁存于芯片中,当WE有效时,写入数据则被存储于指定的单元中。
    的头像 发表于 03-29 15:32 2972次阅读
    <b class='flag-5'>存储</b>芯片是什么样<b class='flag-5'>存储</b>信息的

    NAND存储种类和优势

    非易失性存储器芯片又可分为快闪存储器 (Flash Memory) 与只读存储器 (Read-Only Memory)。其中,快闪存储器又可以分为 NAND
    发表于 03-22 10:54 800次阅读
    NAND<b class='flag-5'>存储</b>种类和优势

    2024年中国存储芯片产业链图谱研究分析

    存储芯片,是嵌入式系统芯片的概念在存储行业的具体应用。受到大模型时代的高算力、大存储的现实需求推动,各大企业加大存储芯片产能扩张力度。
    的头像 发表于 03-13 14:18 2129次阅读
    2024年中国<b class='flag-5'>存储</b>芯片产业链<b class='flag-5'>图谱</b>研究分析

    DNA存储卡:高价与遥远现实

    生物记忆表示,其 DNA 存储卡有望保证 150 年内的数据存储安全,远远超出人类生存年限。然而,对于多数消费者而言,花费如此高价仅换来 1KB 数据容量实属非商业化选择。
    的头像 发表于 01-23 10:29 578次阅读

    段式存储管理和页式存储管理的区别

    段式存储管理和页式存储管理是操作系统中两种常见的内存管理技术,它们在物理内存的分配和管理上有着显著的区别。本文将对这两种存储管理技术进行详细的比较和分析。 一、基本概念 段式存储管理:
    的头像 发表于 12-30 17:17 4629次阅读
    段式<b class='flag-5'>存储</b>管理和页式<b class='flag-5'>存储</b>管理的区别

    文件存储和块存储的区别和联系

    文件存储和块存储是两种常见的数据存储方式,它们在设计思想、数据组织方式、应用场景等方面存在着一些区别和联系。 首先,文件存储是指将数据以文件的形式进行
    的头像 发表于 12-20 17:16 1139次阅读

    数字数据初创公司Biomemory宣布推出1000美元全球首款DNA存储产品

    Biomemory的DNA数据存储卡承诺“最低”寿命为150年。1000美元的价格包括了两张相同的卡——一张用于保存,另一张用于测试检索数据的过程,其中带有1KB的存储空间。
    的头像 发表于 12-18 17:04 865次阅读