0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何利用 AI 获得科学发现

Tensorflowers 来源:工程师李察 2019-04-29 16:30 次阅读

今天,我们很高兴与大家分享 DeepMind 在论证人工智能研究如何推动并加速科学新发现方面的首个重要里程碑。由于我们的研究涉及大量学科领域,DeepMind 汇集了结构生物学、物理学和机器学习领域的多方专家,以应用前沿技术单独根据蛋白质的基因序列预测其 3D 结构。

在过去两年中,我们一直在研究 AlphaFold 系统,该系统基于之前使用海量基因组数据预测蛋白质结构的多年研究构建。AlphaFold 生成的蛋白质 3D 模型远比过去的任何模型都要精确,也因此在某个生物学核心挑战方面取得了重大进展。

什么是蛋白质折叠问题?

蛋白质是维持生命所必需的复杂大分子。人体的每项功能几乎都可以追溯至一种或多种蛋白质,以及这些蛋白质的移动和变化过程,例如收缩肌肉、感知光线或将食物转化为能量。这些蛋白质的配方(即基因)则以编码形式留在我们的 DNA 中。

任何一种蛋白质的功能,都取决于其独一无二的 3D 结构。例如,构成人体免疫系统的抗体蛋白呈 “Y 字形”,类似于形状独特的钩子。通过黏附在病毒和细菌上,抗体蛋白能够检测并标记致病微生物,从而将其消灭。与之类似,胶原蛋白的形状像绳子,可在软骨、韧带、骨骼和皮肤之间传递张力。Cas9 等其他类型的蛋白质以 CRISPR 序列为导向,像剪刀一样剪切并粘贴 DNA 片段;抗冻蛋白的 3D 结构使其能够与冰晶结合,并防止有机体冻结;核糖体的行动如同程序化的装配线一般,帮助蛋白质实现自身构建。

然而,仅依靠蛋白质的基因序列来找出其 3D 形状是一项非常复杂的任务。几十年来,这项难题一直困扰着科学家。这项任务的难点在于,DNA 仅包含关于氨基酸残基(可形成长链)这一蛋白质组成块的信息。所谓的 “蛋白质折叠问题” 便是预测这些链如何折叠成错综复杂的 3D 蛋白质结构。

蛋白质越大,需要考虑的氨基酸相互作用就越多,进行建模的复杂性和难度也就越高。正如利文索尔佯谬中所述,在我们获得正确的 3D 结构之前,我们枚举所有可能的典型蛋白质构型所需的时间可能比宇宙的年龄还要久远。

为什么蛋白质折叠很重要?

预测蛋白质形状的能力对科学家而言非常实用,因为这种能力对理解蛋白质在人体内的作用,以及诊断和治疗业界认为是由错误折叠的蛋白质所引起的疾病(例如阿尔茨海默症、帕金森症、亨廷顿舞蹈症和囊肿性纤维化)至关重要。

尤其令我们兴奋的是了解到蛋白质折叠可能会如何增强我们对人体及其工作原理的理解,进而帮助科学家更高效地设计出能够有效治愈疾病的新疗法。随着我们通过模拟和模型深入了解蛋白质形状及其工作原理,它不仅在药物发现领域展现出新潜力,同时还降低了实验的相关成本。最终,这会改善全世界数百万患者的生活质量。

此外,对蛋白质折叠的理解还将助力蛋白质设计,这将为我们不可胜数的益处。例如,生物可降解酶(可通过蛋白质设计实现)领域的进展有助于管理塑料和石油等污染物,进而帮助我们以更环保的方式分解废物。事实上,研究人员已经开始对细菌进行工程改造,令其分泌出使废物可经过生物降解并更易处理的蛋白质。

为了促进研究和衡量用于提高预测准确度的最新方法取得的进步,业界于 1994 年成立了名为蛋白质结构预测技术关键评估 (CASP) 的社区范围实验,该全球竞赛每两年举行一次,现已成为评估此类技术的黄金标准。

AI 如何大显身手?

在过去 50 年间,科学家已经能够在实验室中使用低温电子显微技术、核磁共振或 X 射线晶体学等实验性技术确定蛋白质的形状。但每种方法都要经过大量尝试与失败,每个结构都需耗时数年,且成本高达数万美元。这正是为什么生物学家将目光转向 AI 方法,希望用其取代这种漫长而艰苦的复杂蛋白质处理过程。

幸运的是,得益于基因测序成本的迅速降低,基因组学领域的数据相当丰富。因此在过去几年里,越来越多的研究人员利用深度学习方法来处理依赖于基因组数据的预测问题。在 DeepMind 对此类问题的研究中,AlphaFold 应运而生。今年,我们已向 CASP 提交了该作品。令我们引以为傲的是,CASP 的组织方评价 AlphaFold 是 “在预测蛋白质结构的计算方法能力方面取得的空前进展”,并在入围的众多参赛团队中,将第一名的桂冠颁发给我们(我们的参赛名称是 A7D)。

我们的团队特别关注从零开始对目标形状进行建模这一难题,而且并未使用此前已经解决的蛋白质结构作为模板。我们在预测蛋白质结构的物理属性时实现了高准确度,然后使用两种截然不同的方法来构建对蛋白质完整结构的预测。

利用神经网络预测物理属性

上述两种方法均依赖深度神经网络,这些经过训练的神经网络可以从其基因序列中预测蛋白质属性。该网络预测的属性包括:(a) 氨基酸对的间距和 (b) 连接这些氨基酸的化学键之间的角度。此方法的首要进步是改进了常用技术,这些技术可以估算氨基酸对是否彼此接近。

我们训练了一个神经网络,以预测蛋白质中每个残基对之间的单独距离分布。然后,我们将这些概率合并为分数,以估计所提出的蛋白质结构的精确程度。我们还训练了一个单独的神经网络,其综合使用所有距离来估算所提出的结构与正确答案的接近程度。

构建蛋白质结构预测的新方法

使用这些评分功能,我们能够搜索蛋白质结构,以找到符合预测的结构。第一种方法基于结构生物学的常用技术构建,并使用新的蛋白质片段反复替换蛋白质片段。我们训练了一个生成式神经网络来创建新片段,并针对所提出的蛋白质结构,利用这些片段不断提高其分数。

第二种方法通过梯度下降(机器学习领域常用的一种数学技术,能够不断产生微小的改进)来优化分数,进而生成高度精确的结构。此技术应用于整条蛋白质链,而非在组装前须分开折叠的片段,因而可简化预测过程。

未来如何发展?

我们首次涉足蛋白质折叠领域便取得成功,展示了机器学习系统如何整合各类信息来源,帮助科学家快速提出解决复杂问题的创造性解决方案。正如我们所见,AI 可通过 AlphaGo 和 AlphaZero 等系统帮助人们掌握复杂的游戏。同样地,我们希望某一天 AI 技术的突破也能帮助我们处理基本的科学问题。

我们很高兴看到蛋白质折叠领域的早期发展迹象,这证明了 AI 在科学发现中的作用。尽管该技术在对治疗疾病、管理环境等方面产生可量化影响之前仍需深入研究,但我们明白,AI 的潜力不可限量。在拥有重点研究机器学习如何推动科学世界进步的专门团队后,我们期待自己的技术能够在众多领域大展身手。

在我们发表关于此项研究的论文之前,请将其引用为:《通过基于评分的深度学习进行从头结构预测》(De novo structure prediction with deep-learning based scoring)R.Evans、J.Jumper、J.Kirkpatrick、L.Sifre、T.F.G.Green、C.Qin、A.Zidek、A.Nelson、A.Bridgland、H.Penedones、S.Petersen、K.Simonyan、S.Crossan、D.T.Jones、D.Silver、K.Kavukcuoglu、D.Hassabis、A.W.Senior发表于 2018 年 12 月 1 日至 4 日举行的第 13 届蛋白质结构预测技术关键评估(摘要)。如需查看摘要,请点击 此处(https://deepmind.com/documents/262/A7D_AlphaFold.pdf)。

此项研究是与以下人员协作完成:Richard Evans、John Jumper、James Kirkpatrick、Laurent Sifre、Tim Green、Chongli Qin、Augustin Zidek、Sandy Nelson、Alex Bridgland、Hugo Penedones、Stig Petersen、Karen Simonyan、Steve Crossan、David Jones、David Silver、Koray Kavukcuoglu、Demis Hassabis 和 Andrew Senior

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30098

    浏览量

    268375
  • 模型
    +关注

    关注

    1

    文章

    3162

    浏览量

    48708
  • 光线
    +关注

    关注

    0

    文章

    67

    浏览量

    10523

原文标题:AlphaFold:利用 AI 获得科学发现

文章出处:【微信号:tensorflowers,微信公众号:Tensorflowers】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这一章详细
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    领域的重要工具和方法,推动生命科学的深入发展和广泛应用。同时,我们也应该清醒地认识到,这个过程中也伴随着诸多挑战和困难。只有不断克服这些挑战,才能充分利用AI技术的优势,为生命科学的发
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究中的核心技术,包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析复杂的数据集,从而发现隐藏在数据中的模式和规
    发表于 10-14 09:16

    AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不
    发表于 10-14 09:12

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    ! 《AI for Science:人工智能驱动科学创新》 这本书便将为读者徐徐展开AI for Science的美丽图景,与大家一起去了解: 人工智能究竟帮科学家做了什么? 人工智能
    发表于 09-09 13:54

    如何利用traceroute命令发现网络中的负载均衡

    在网络管理和故障排除中,了解数据包的路径和识别负载均衡节点是非常重要的。traceroute 命令是一个用于跟踪数据包在网络中经过的路由路径的工具。本文将详细介绍如何利用 traceroute 命令发现网络中的负载均衡,并解释相关的概念和技术细节。
    的头像 发表于 08-07 15:13 329次阅读
    如何<b class='flag-5'>利用</b>traceroute命令<b class='flag-5'>发现</b>网络中的负载均衡

    中国科学发现新型高温超导体

    据新华社报道,我国科学家再立新功,又一新型高温超导体被发现。 复旦大学物理学系赵俊团队利用高压光学浮区技术成功生长了三层镍氧化物,成功证实在镍氧化物中具有压力诱导的体超导电性,而且超导体积分数达到
    的头像 发表于 07-19 15:14 625次阅读

    如何利用AI进行提升自我呢?

    利用AI进行学习是一个高效且富有创新性的过程。以下是一些建议,帮助你充分利用AI进行学习: 选择适合的AI学习工具 : 深度学习框架 :如飞
    的头像 发表于 07-19 10:46 489次阅读

    助力科学发展,NVIDIA AI加速HPC研究

    科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作。
    的头像 发表于 05-14 09:17 384次阅读
    助力<b class='flag-5'>科学</b>发展,NVIDIA <b class='flag-5'>AI</b>加速HPC研究

    发现Minitab 22的强大之处!#人工智能 #Ai #Minitab

    AIMinitab
    MinitabUG
    发布于 :2024年04月17日 11:50:39

    微软支付6.5亿美元获得Inflection AIAI模型授权

    微软近日宣布向人工智能初创公司Inflection AI支付高达6.5亿美元的巨额资金,这一举动在业内引起了广泛关注。据悉,这笔资金主要用于获得Inflection AIAI模型授权
    的头像 发表于 03-25 10:39 471次阅读

    安进将开发生成式AI模型,以获取新的人类数据洞察并推动药物发现

    生成式 AI 正在改变药物研发,以前所未有的速度实现新药物发现。作为全球领先的生物技术公司之一,安进(Amgen)正在利用这项技术推进科研工作。
    的头像 发表于 03-20 11:30 404次阅读

    2024 CSRankings全球计算机科学排名发布!AI领域中国高校霸榜

    CSRankings 2024结果出炉!全世界计算机科学机构的排名进行了大更新。在AI板块,清华、北大、上交分列TOP 3,CMU和浙大并列第4。AI TOP 10中的中国高校
    的头像 发表于 01-08 09:28 1276次阅读
    2024 CSRankings全球计算机<b class='flag-5'>科学</b>排名发布!<b class='flag-5'>AI</b>领域中国高校霸榜

    DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解

    的知识吗? 由于 LLM 已被证明存在「幻觉」问题,即生成与事实不符的信息,因此利用 LLM 来做可验证的正确发现是一项挑战。 现在,来自 Google DeepMind 的研究团队提出了一种为数学和计算机科学问题搜索解决方案的
    的头像 发表于 12-18 15:55 284次阅读

    AWS和英伟达携手推进AI,谷歌DeepMind重塑材料科学

    DeepMind在材料科学领域的最新发现,即220万种晶体结构的识别,将如何彻底改变我们对新材料发现和应用的理解。这些突破性成就不仅代表了科技的巨大进步,也为未来的产业发展铺平了道路。 AWS与英伟达加强合作,推动
    的头像 发表于 11-30 21:50 532次阅读
    AWS和英伟达携手推进<b class='flag-5'>AI</b>,谷歌DeepMind重塑材料<b class='flag-5'>科学</b>