0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AlphaFold有望改变生物学

医健AI掘金志 来源:IoT科技评论 作者:IoT科技评论 2020-12-15 17:53 次阅读

AlphaFold有望改变生物学。

近日,谷歌AI团队DeepMind所研究的 AlphaFold 算法在生物学领域取得了重要突破:通过蛋白质的氨基酸序列高精度地确定其3D结构。

具体而言,是DeepMind的第二代AlphaFold 在国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手,能够精确地基于氨基酸序列,预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。

前基因泰克(Genentech)首席执行官Arthur D. Levinson博士称这一成就为“划时代的进步”(once in a generation advance)。

从CASP14,这项权威的蛋白质结构预测竞赛结果中,可以看到AlphaFold2排名第一(总分远高于第二),排名前六位的分别是David Barke lab的两个工具(第二、第三位)、密歇根州立大学的 Michael Feig和密歇根大学Yang Zhang排名在第四位、第五位,而腾讯AI lab 的tFold_human 排名第六。

420a6d2e-34d3-11eb-a64d-12bb97331649.png

这说明,在某种程度上,在对蛋白质结构和折叠的预测这件事情上,人类已非望尘莫及。

第二代AlphaFold做了什么?

在CASP这项比赛中,DeepMind开发AlphaFold2用的数据是:数据库里的超过17万种蛋白序列与结构,以及其他一些大型数据库里的数据。

评估蛋白结构预测准确度的指标叫做GDT,也就是评估预测结构里的氨基酸位置,和实际的氨基酸位置差多少。差得越少,得分越高。

GDT的分值在0-100之间。2006-2016年间,这个数字最高在40左右。2018年,上一代的 AlphaFold得分一下子突破了50。而这次的新一代 AlphaFold,在蛋白结构预测大赛里的中位得分超过了92.4。

不仅仅远超今年的竞争对手,相比于2018年版的AlphaFold第一代,AlphaFold2的表现也如脱胎换骨一般。

更直观一些。拿它预测的结构与实际结构对比,可以看到基本完全吻合(下图,绿色是实验得到的实际结构,蓝色是计算预测结构)。

4f95cbf0-34d3-11eb-a64d-12bb97331649.png

在两年一次的蛋白质结构预测关键评估(CASP)竞赛中,AlphaFold今年击败了所有其他小组,并在准确率方面与实验结果相匹配。随着预测难度增加,AlphaFold的准确率保持在稳定的高水平,表现远超其它团队以及往届竞赛的水平。

但是对此结果,也有不少人存在疑问,主要在准确性。首先,17万的数据应该远远不够,准确性存疑;再者,蛋白质结构折叠问题太过高深,如果真能够破解,DeepMind很快就能获得诺贝尔奖。

因此,在惊叹AlphaFold取得成果的同时,我们还需要冷静等待生物学家的实验验证。

除了解决的问题值得我们关注,其实研究方法也更有思考价值。

毕竟,AlphaFold的结构预测与X射线晶体学或低温电子显微镜(cryo-EM)等标准实验方法来预测并无区别,只是后者更加费力、更加昂贵。科学家表示,AlphaFold的出现也许并不会完全替代这些实验方法,但确实为人们提供了研究生物的新方式。

蛋白质结构:生物学五十年来的挑战

蛋白质是生命的基础,与细胞组成内容紧密相关。而蛋白质的功能取决于其3D结构。

一直以来,生物学家投入实验,致力于寻找生命的奥秘,即:氨基酸序列(蛋白质的组成部分)是如何绘制出最终的形状。

在过去,人们一直是通过实验室来了解蛋白质的结构。比如,使用X射线束照射结晶的蛋白质,并将衍射光转化为蛋白质原子坐标,由此掌握蛋白质的第一个完整结构。

除了实验,随着计算机的发展,该项技术在上世纪末便已用于预测蛋白质的结构,但效果并不理想。

计算机技术用于蛋白质结构预测的困境,直到AlphaFold在2018年现身于CASP,才让科学家重新燃起了信心与希望。

AlphaFold的第一次迭代将深度学习应用于结构和遗传数据,以预测蛋白质中氨基酸对之间的距离。根据AlphaFold的主要负责人之一John Jumper介绍,在第二个步骤中,虽然没有使用AI技术,但AlphaFold使用结构与遗传数据得出了蛋白质的外观模型,与之前的研究达成一致。

但第一次迭代存在缺陷。因此,该团队开发了一个AI网络。该网络结合了有关确定蛋白质如何折叠的物理和几何约束的信息。他们设立了一项艰巨的目标:该网络能够预测目标蛋白质序列的最终结构,而不仅是预测氨基酸之间的关系。

惊人的准确性

CASP的进行历时数月。

1994年,Moult及其同事发起了CASP,每两年召开一次。比赛团队获得约100种蛋白质的氨基酸序列,其结构未知。一些小组计算每个序列的结构,而另一些小组则通过实验确定它。然后,组织者将计算预测结果与实验室结果进行比较,并为预测结果提供全球距离测试(GDT)分数。

研究小组有数周的时间来提交其结构预测。然后,一组独立的科学家使用度量标准来评估预测的蛋白质与实验确定的结构的相似程度,以此评估各个研究小组的预测结果。研究小组的名称为匿名。

在今年的比赛中,AlphaFold的称号是“427组”。其预测的许多条目具有惊人的准确性,将近三分之二的预测与实验所得的结构相当。

针对各种目标蛋白,AlphaFold的GDT中位数得分为92.4。在难度中等的蛋白质上,其他团队的最佳表现通常在预测准确度上得分75(满分100),而在AlphaFold则得分大约90,中位数为87,比下一个最佳预测高25分。

AlphaFold甚至擅长解决楔入细胞膜中的蛋白质结构,这是许多人类疾病的核心,但众所周知,这个问题用X射线晶体学都很难解决。医学研究理事会分子生物学实验室的结构生物学家Venki Ramakrishnan称该结果“在蛋白质折叠问题上取得了惊人的进步。”

Moult介绍,90分以上得分的预测结果与实验方法相当。

不过,AlphaFold并非完美胜任所有的预测。在一种由52个小重复片段组成、组装时会扭曲彼此位置的蛋白质上,AlphaFold的预测与实验结果之间存在部分差异。

CASP的负责人Moult介绍,无法确定是因为AlphaFold的预测误差,还是因为实验的伪像。

此外,AlphaFold的预测与通过核磁共振成像技术确定的实验结构的匹配度差,可能是因为AlphaFold将原始数据转换为模型的方法需要改进。

再如,AlphaFold的网络尝试为蛋白质复合物或组中的单个结构建模,因此,与其他蛋白质的相互作用扭曲了它们的形状。

应用

AlphaFold的预测有助于确定Lupas实验室多年来试图破解的细菌蛋白质的结构

Lupas的研究小组以前曾收集过原始的X射线衍射数据,但要将这些类似Rorschach的图案转换为结构,则需要了解蛋白质的结构信息。Lupas介绍:“在我们花了十年时间尝试一切之后,427组的模型在半小时内为我们提供了结构。”

DeepMind的联合创始人兼首席执行官Demis Hassabis介绍,AlphaFold可能需要几天的时间才能预测出蛋白质的结构,包括对蛋白质不同区域的可靠性估计。但AlphaFold将开放给科学家使用。

Hassabis认为,AlphaFold有望应用于药物发现和蛋白质设计。

借助AlphaFold,药物设计人员能够快速确定危险的新病原体(如SARS-CoV-2)中各种蛋白质的结构,这是寻找分子以阻止疾病产生的关键步骤。

加州大学伯克利分校的分子神经生物学家Stephen Brohawn说,DeepMind对一种叫做Orf3a的蛋白质的预测最终与后来通过cryo-EM确定的蛋白质非常相似。

AlphaFold的出现,可能意味着获得良好的蛋白质结构,不再局限于实验室,而只需要低质量的、易于收集的实验数据。比方说,类似蛋白质的进化分析等方向之所以能蓬勃发展,便是因为有大量的基因组数据能够被转化为结构。

科学家评论,AlphaFold能够帮助人类了解生命基因组中数千种未溶解蛋白质的功能,了解人与人之间因为疾病而产生的基因变异。

AlphaFold的出现也改写了外界对DeepMind的印象。此前,大家知道DeepMind,一般是因为该团队使用AI来玩游戏,比如AlphaGo。但如今,AlphaFold涉足生物学领域,例如进行蛋白质结构预测,DeepMind也因此向外界传达了自己的另一种声音:

不仅能玩围棋,还能使用AI帮助生命科学的长远发展。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4611

    浏览量

    92867
  • 数据库
    +关注

    关注

    7

    文章

    3799

    浏览量

    64376
  • DeepMind
    +关注

    关注

    0

    文章

    130

    浏览量

    10857

原文标题:划时代的进步!DeepMind第二代AlphaFold破解生物学“五十年难题”,可精准预测蛋白质3D结构

文章出处:【微信号:IoT_talk,微信公众号:医健AI掘金志】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浅谈生物传感技术的定义、发展现状与未来

      在科技日新月异的今天,生物传感技术作为一项前沿科技,正逐渐展现出其巨大的潜力和价值。它不仅是生物学与电子技术的完美结合,更是连接生物世界与数字世界的桥梁。通过检测生物体内的生化反应
    的头像 发表于 12-06 01:03 434次阅读

    微流控技术的生物学应用

    微流控技术为在推动生物学众多领域的强大工具做出了巨大贡献。随着用于微通道中流体的注射、混合、泵送和存储的新器件和工艺的发展,近年来微流控系统在化学和生物化学中的应用越来越广泛。 尽管微流控技术近年来
    的头像 发表于 12-01 21:50 137次阅读

    生物传感器:科技前沿的生物监测利器

    融合了生物学、化学、物理学和电子的交叉学科技术,正逐步成为连接生物世界与数字世界的桥梁。它不仅在医疗诊断、环境监测、食品安全等领域发挥着重要作用,还在农业生产、生物学研究以及未来的可
    的头像 发表于 11-20 15:12 779次阅读

    NVIDIA 推出 BioNeMo 开源框架,扩大全球生物制药和科学行业的数字生物学研究规模

    阿贡国家实验室计算科学小组负责人 Arvind Ramanathan 表示:“美国阿贡国家实验室贡献了数十亿参数的生物模型,这些模型需要使用专门的软件在高性能计算环境中训练而成。BioNeMo 为美国
    发表于 11-19 14:01 124次阅读
    NVIDIA 推出 BioNeMo 开源框架,扩大全球<b class='flag-5'>生物</b>制药和科学行业的数字<b class='flag-5'>生物学</b>研究规模

    生成式AI模型推进数字生物学发展

    Meta 的开放大语言模型(已优化并可作为 NVIDIA NIM 下载)为数字健康和生命科学工作流提供动力支持。
    的头像 发表于 09-13 17:18 584次阅读

    光电倍增管在医疗领域的应用

    这些微弱的荧光信号,并将其转换为电信号进行放大和处理,从而得到高质量的荧光图像。这对于细胞生物学、分子生物学和病理学等领域的研究具有重要意义。
    的头像 发表于 08-09 17:22 680次阅读

    ADI与与生物平台创新公司Flagship Pioneering达成战略合作

    与Flagship Pioneering在应用生物学领域的专长,共同推动生物学见解的发掘以及全新及增强的测量、诊断与新型干预措施。此次合作为双方带来了难得的机遇,旨在共创面向人类健康与可持续发展的突破性解决方案。
    的头像 发表于 07-29 10:38 755次阅读

    合成生物是什么-微流控芯片技术在合成生物学的应用前景

    合成生物其实就是一种“造物”的技术。它融合了生物学、化学和工程等多种技术,以可再生生物质为原料,以生物体作为生产介质,旨在利用廉价原料,以
    的头像 发表于 05-28 13:58 758次阅读
    合成<b class='flag-5'>生物</b>是什么-微流控芯片技术在合成<b class='flag-5'>生物学</b>的应用前景

    谷歌DeepMind发布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日发布了人工智能模型AlphaFold的最新版本——AlphaFold 3,这一革命性的工具将在药物发现和疾病治疗领域发挥巨大作用。
    的头像 发表于 05-10 11:26 590次阅读

    DeepMind推出AlphaFold 3,预测生命分子交互,开辟全新医疗领域

    据悉,AlphaFold 3能精确预测人体每一个细胞分子的复杂形态,以及它们之间的连接方式,并揭示微小变化如何影响可能引发疾病的生物功能。
    的头像 发表于 05-09 14:22 391次阅读

    三郡科技:电化学生物传感器电极与生物芯片的异同

    电化学生物传感器电极 与 生物芯片 作为生物技术领域中的两大重要工具,为现代生物分析和医学诊断提供了强有力的支持。虽然它们都涉及生物学和电子
    的头像 发表于 04-28 14:08 784次阅读
    三郡科技:电化学<b class='flag-5'>生物</b>传感器电极与<b class='flag-5'>生物</b>芯片的异同

    用于增强微生物物种间DNA转移的新型液滴微流控平台设计

    利用各种合成生物学工具和方法进行微生物工程已经取得了重大进展。
    的头像 发表于 03-17 10:41 974次阅读
    用于增强微<b class='flag-5'>生物</b>物种间DNA转移的新型液滴微流控平台设计

    有望加速甚至改变噬菌体的芯片纳米“光镊”

    瑞士和法国科学家携手,开发出一种芯片上的纳米“光镊”,能以最小光功率捕获、操纵和识别单个噬菌体,有望加速甚至改变基于噬菌体的疗法,治疗具有抗生素耐药性的细菌感染。
    的头像 发表于 03-04 14:07 594次阅读
    <b class='flag-5'>有望</b>加速甚至<b class='flag-5'>改变</b>噬菌体的芯片纳米“光镊”

    高通量测序技术及原理介绍

    高通量测序技术是生物学领域中一种重要的分析工具,它可以快速、准确地测定DNA序列或RNA序列。高通量测序技术的出现,极大地促进了基因组、转录组以及生物信息学等领域的发展。本文将从高
    的头像 发表于 02-03 14:46 1.2w次阅读

    日本研发双足混合机器人,水下行走、急转弯自如

    该篇文章的主要撰写人和通讯作者,东京大学教授竹内昌治表示,生物混合型机器人是生物学与力学的巧妙结合,为机器人领域开辟了全新的视角。运用肌肉做动力源,他们成功创建了一款行动快捷且无声的紧凑型机器人。
    的头像 发表于 01-29 11:24 673次阅读