0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对探索蛋白质折叠有了全新远景!

电子工程师 来源:lq 2019-04-29 18:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

几乎每一个生命基本生化过程都与蛋白质息息相关。通过它们构造并保持每个细胞和组织的外观结构;构建那些维持生命化学反应的催化酶;成为分子的加工厂、转换器和驱动机;担当信号器并接收蜂窝信号等等。

由氨基酸和蛋白质组成的长链,将它们自己折叠成精准3D结构,可以管理分子间活动的复杂问题。因为,蛋白质外形决定了它的功能和疾病中产生的功能紊乱,并影响蛋白质在分子生物学的中心地位,特别是用于治疗科学和治病保健等药物的发展。

近些年,蛋白质通过自身的氨基酸序列可以实现被预测,在计算方法上有了巨大进步。如果都能使用这些计算方法,那生物医学研究都可以被转换成计算公式。然而,现在一些应用则受到了蛋白质规模和范围的局限而无法决策。

近期,来自哈佛医学院的科学家应用了深度学习的方法,基于氨基酸序列来有效预测蛋白质的3D结构。17年4月,在Cell Systems上的一篇文章中,系统生物学家Mohammed AIQuraishi阐述了一种可以用来预测蛋白质结构的新计算方法,不但达到现在计算方法准确性,而且速度可以提高到一百万倍以上。

“蛋白质折叠在近半个世纪里,一直以来都是困扰生物化学家们最重要的难题,但是这种方法给解决这类难题提供了一个新方向。” 哈佛医学院Blavatnik学院系统生物学的教导主任AIQuraishi如是说。

“我们现在对探索蛋白质折叠有了全新远景,同时我觉得我们正在一步步深入本质。”

理论的提出

虽然理论的探索非常成功,但使用物理工具识别蛋白质结构的过程却是昂贵和费时的。因此,绝大多数蛋白质结构,以及致病突变对这些结构的影响在很大程度上仍是未知的。

如果能设计出计算蛋白质折叠的算法,是极有潜力大幅度降低塑造结构的成本和时间。但是这个问题一直困扰着我们长达四十年之久。

可视化模拟AlQuraishi的蛋白质折叠深度学习方法。该模型通过反复预测结构(彩色)并将其预测与地面真实结构(灰色)进行比较来训练。这是重复成千上万的已知蛋白质,随着模型的学习和提高其准确性的每一次迭代。

蛋白质从二十多种的氨基酸中构建起来,这就像把字母从字母表中挑出来,连词逐句构建文章。

然而,与那些字母不同的是,氨基酸是存在于3D空间中的实物。

通常,蛋白质的各个部分在物理上很接近,但在序列上却有很大的距离,因为它的氨基酸链形成了环状、片状和螺旋形。“这个问题让人瞩目在于可以简单表述:抓取一个序列并研究出它的形状,”AIQuraishi如是说,“蛋白质一开始是一个非结构化的字符串,它必须呈现出三维的形状,而一个字符串可以折叠成的形状集是巨大的。许多蛋白质由数千个氨基酸组成,其复杂性很快超过了人类直觉甚至是最强大的计算机的能力。”

难以解决的问题

为了解决这一难题,科学家们利用氨基酸之间相互作用的事实,根据物理定律,寻找积极有利的状态,简直就是杯水车薪。

在超级计算机上计算蛋白质结构是目前最先进的算法,在Rosetta@Home和Folding@Home这样的项目中,这些超级计算机或众包计算能力可以模拟氨基酸通过强力相互作用的复杂物理过程。

为了减少大量的计算需求,这些项目依赖于将新的序列映射到预先定义的模板上,并通过之前的实验确定的蛋白质结构。

很多研究学者对谷歌的AlphaFold一类项目很感兴趣,他们是利用人工智能技术来预测蛋白质的结构。为此,这些方法分析了大量的基因组数据,其中包含蛋白质序列的蓝图。他们寻找许多可能共同进化的物种之间的序列,利用这些序列作为接近身体的指标来指导结构装配。

然而,这些人工智能方法并不仅仅基于蛋白质的氨基酸序列来预测结构。因此,它们在确定没有先验知识的蛋白质结构、进化独特的蛋白质或人类设计的新蛋白质方面的能力有限。

进一步试验

为了开发一种新的方法,AlQuraishi应用了所谓的端到端可微深度学习。这一人工智能分支极大地降低了解决图像和语音识别等问题所需的计算能力和时间,并应用在Siri和谷歌翻译等程序上。

从本质上讲,可微学习涉及到一个单一的、庞大的数学函数(高中微积分方程的更复杂版本),它被安排为一个神经网络,网络的每个组成部分向前和向后提供信息。在难以想象的复杂情况下,这个方程依旧可以自我调节,以便准确地“了解”蛋白质序列在数学上是如何与其结构相关联的。

AlQuraishi开发了一个深度学习模型,称为循环几何网络,主要研究蛋白质折叠的关键特征。但在做出新的预测之前,它必须使用之前确定的序列和结构进行训练。

上图展示的是循环几何网络模型是如何计算氨基酸肽键的夹角和这些肽键的旋转角度,去形成一个蛋白质的几何结构。

对于每一种氨基酸,该模型都能预测出将氨基酸与其相邻氨基酸连接起来的化学键的最可能角度。它还预测了这些键的旋转角度,从而影响到蛋白质的任何局部区域与整个结构的几何关系。

这将不断重复进行,每一个计算都是由其他氨基酸的相对位置决定的。一旦整个结构完成,该模型通过将其与蛋白质的“地面实况”结构进行比较,来检验其预测的准确性。整个过程对数千种已知的蛋白质重复进行,每一次重复都会使模型学习的准确性得到提高。

初步成果

当模型被训练好时,AlQuraishi测试了它的预测能力。他将其性能与近年来“蛋白质结构预测关键评估”的其他方法进行了比较。蛋白质结构预测关键评估是一项年度实验,测试计算方法利用已确定但未公开发布的蛋白质结构进行预测的能力。

他发现,在预测没有预先存在模板的蛋白质结构方面,新模型优于所有其他方法,包括使用共同进化数据的方法。当预先存在的模板可用来进行预测时,它的性能也比所有方法都好,只有最好的方法除外。

AlQuraishi指出,尽管准确性上的提高相对较小,但在这些测试的最顶端很难实现任何改进。因为这种方法代表了一种全新的蛋白质折叠方法,无论物理上还是计算上都是现有方法的补充, 来确定比以前更广泛的结构。

值得注意的是,新模型的预测速度比现有的计算方法快6到7个数量级。训练这个模型可能需要几个月的时间,但一旦训练,它可以在几毫秒内做出预测,而使用其他方法需要几小时到几天的时间。这种显著的改进部分是由于它所基于的单一数学函数,只需要几千行计算机代码就可以运行,而不是数百万行。

AlQuraishi说,这个模型的预测速度之快使得以前速度慢或难以实现的新应用成为可能,比如预测蛋白质在与其他分子相互作用时如何改变形状。

“深度学习方法,不仅仅是我的方法,其预测能力和受欢迎程度将继续增长,因为它们代表了一种最小的、简单的范例,能够比当前复杂的模型更容易地集成新思想,”他补充说。

AlQuraishi说,这个新模型还不能立即用于药物发现或设计,因为目前它的精确度大约在6埃左右,离解决蛋白质的完整原子结构所需的1埃到2埃还有一段距离。

但他说,有很多机会可以优化这种方法,包括进一步整合化学和物理的规则。AlQuraishi说: 准确、有效地预测蛋白质折叠一直是这个领域的圣杯,我期待这种方法,连同所有其他已经开发出来的杰出方法,在不久的将来能够做到这一点。

“AIQuraishi的工作给人的印象极深,尤其是敢于单枪匹马与Google这类公司,在最火的计算机领域之一同台竞争,并深入到具有良好研究系统的哈佛医学院和波士顿生物医药社区。”作为哈佛医学院Blavatnit系的Otto Krayer教授,兼系统病理实验室主任的彼得佐格尔如是说。

为了让大家更好的体验并参与到算法研发中,AIQuraishi已经将全部软件和结果在GitHub软件分享平台上发布。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 转换器
    +关注

    关注

    27

    文章

    9463

    浏览量

    157195
  • 人工智能
    +关注

    关注

    1821

    文章

    50471

    浏览量

    267612
  • 深度学习
    +关注

    关注

    73

    文章

    5613

    浏览量

    124723

原文标题:折叠革命,深度学习通过氨基酸序列预测蛋白质结构

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为阔折叠赛道再添新成员,最适合玩游戏的折叠机来了!

    市场 C 位,成为各大品牌角逐高端赛道的核心技术高地。 就在不久前,华为重磅推出全新大阔折旗舰华为Pura X Max,并且公布各版本配置的官方售价。作为华为在折叠屏领域的又一里程碑式突破,这款产品不仅实现
    的头像 发表于 05-14 17:31 325次阅读
    华为阔<b class='flag-5'>折叠</b>赛道再添新成员,最适合玩游戏的<b class='flag-5'>折叠</b>机来了!

    FRED应用:毛细管电泳系统

    、毛细管中的激光诱导荧光和人类皮肤模型,FRED和生物医疗产业的相关性能得到最好的表达。 激光诱导荧光-毛细管电泳 毛细管电泳是一个在遗传分析和蛋白质表征中使用的技术。准直激光束聚焦到一个玻璃毛细管柱上
    发表于 04-28 08:09

    筑基AI4S:摩尔线程全功能GPU加速中国生命科学自主生态

    了生命科学AI的三类关键技术,其能力直接决定新药研发的效率与精准医疗的进程。 然而,作为这三类关键技术之一的蛋白质结构预测模型AlphaFold 3,其训练代码未完全开放,商业使用亦受限,这使得科学家难以基于该模型构建真正自主可控的研发环境。这
    的头像 发表于 04-17 17:47 1331次阅读
    筑基AI4S:摩尔线程全功能GPU加速中国生命科学自主生态

    NVIDIA携手Google DeepMind与EMBL发布全球最大蛋白质复合物数据集

    进行了大规模扩展,为可搜索数据库新增 170 万个高置信度预测的蛋白质复合物,并提供约 3000 万个额外预测结构供批量下载。
    的头像 发表于 03-25 09:39 423次阅读

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    NVIDIA BioNeMo 平台的一部分,Proteina-Complexa 模型可加速蛋白质药物研发——同时推出全新开放数据集,包含数百万条由 AI 预测的蛋白质复合物结构数据,该数据集由 NVIDIA、谷歌 DeepMi
    的头像 发表于 03-17 09:18 605次阅读
    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    东软载波微电子提供基于ES8H0494系列产品的干衣机显示板方案

    随着人们对生活品质要求的提高,干衣机已逐渐成为现代家庭的刚需。传统烘干机的高温环境容易破坏衣物的蛋白质纤维,且长时间的高温烘干会让棉质衣物变得僵硬,失去柔软度。干衣机的出现便解决这些问题,干衣机
    的头像 发表于 02-26 10:33 829次阅读
    东软载波微电子提供基于ES8H0494系列产品的干衣机显示板方案

    中科曙光联合发布全球首个蛋白质结构智能压缩与生成AI服务器Protein-OCR

    近日,中科曙光与天目湖健康研究院、ENTROPITech、苏州大学、北京大学等多家中国顶尖科研机构联合发布全球首个蛋白质结构智能压缩与生成AI服务器Protein-OCR。在底层逻辑上
    的头像 发表于 02-25 16:27 559次阅读

    NVIDIA Clara开放模型加速科学与医疗行业变革

    Clara 为从预测蛋白质结构到设计可在实验室合成的分子的整个早期药物发现流程提供支持。
    的头像 发表于 11-06 11:42 1220次阅读

    福禄克流量校准系统在生物制药行业的应用

    在生物制药行业,生物反应器和发酵罐是生产生物制品(如疫苗、单克隆抗体和治疗性蛋白质)的核心设备。氧气、氮气或二氧化碳等气体的精密流量控制对于维持细胞生长、代谢和产品产量的最佳条件至关重要。
    的头像 发表于 10-31 17:00 1784次阅读

    中科曙光超智融合技术重塑生物医药研发新范式

    当前,海量生物数据的处理与分析能力已成为制约行业发展的关键瓶颈。近日,依托曙光超智融合技术建设的华东某全国产计算中心,与单细胞测序领域代表性企业墨卓生物达成战略合作。以强大算力为单细胞测序、蛋白质结构预测及海量临床样本分析提供支撑,加速精准诊断进程,重塑生物医药研发与应用的全流程范式。
    的头像 发表于 08-11 11:12 1366次阅读

    火极一时的AI蛋白质解析,怎么样

    AI蛋白质解析领域正在经历一场静水流深的变革
    的头像 发表于 07-27 17:18 2527次阅读
    火极一时的AI<b class='flag-5'>蛋白质</b>解析,怎么样<b class='flag-5'>了</b>?

    亚纳米级检测!潜望式棱镜的“检测密码”,决定手机远景清晰度

    手机变薄远景拍摄却更清晰?全靠这个 “躺平” 的零件在发力!优可测白光干涉仪如何让手机清晰拍摄远景照片?
    的头像 发表于 07-21 17:33 1302次阅读
    亚纳米级检测!潜望式棱镜的“检测密码”,决定手机<b class='flag-5'>远景</b>清晰度

    为什么政务大厅/高校/智能园区都在选远景达无人超市?

    在数字化转型的浪潮下,政务大厅、高校和智能园区正加速探索高效、智能的服务模式。远景达无人超市凭借其先进的技术方案和精准的场景适配能力,成为这些场景的优选方案,其核心优势体现在以下几个方面:一、政务
    的头像 发表于 06-25 14:40 670次阅读
    为什么政务大厅/高校/智能园区都在选<b class='flag-5'>远景</b>达无人超市?

    鸿蒙5开发宝藏案例分享---三折叠应用开发分享

    方案。话不多说,直接上干货,结合代码带大家玩转三折叠屏开发! ?三折叠的三种状态与断点适配 三折叠手机(如Mate XT) 三种核心状态 ,对应不同布局策略: 单屏态(F态) **:
    发表于 06-12 15:47

    鸿蒙5开发宝藏案例分享---折叠屏开发实践

    ?** 最佳实践案例大揭秘!开发者的隐藏宝藏手册** 大家好呀! 今天在翻鸿蒙文档时突然发现一个惊天大宝藏——官方其实早就默默放出了 几十个超实用开发案例 ,覆盖折叠屏适配、性能优化、UI框架、跨
    发表于 06-12 11:44