0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA BioNeMo框架将为生物学研究提供加速

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-09-26 09:23 次阅读

领先的制药公司、生物技术初创企业和前沿生物研究人员正在使用 NVIDIA BioNeMo LLM 服务和框架来开发用于生成、预测和理解生物分子数据的 AI 应用。

科学家们致力于探索 DNA、蛋白质和其他生命体的“基础构建”,以期获得全新的洞察,而今日在 NVIDIA GTC 上发布的 NVIDIA BioNeMo 框架将为其研究提供加速。

NVIDIA BioNeMo 框架用于训练和部署超算规模的大型生物分子语言模型,帮助科学家更好地了解疾病,并为患者找到治疗方法。该大型语言模型(LLM)框架将支持化学、蛋白质、DNA 和 RNA 数据格式。

NVIDIA BioNeMo 是 NVIDIA Clara Discovery 药物研发框架、应用和 AI 模型集的一部分。

正如 AI 通过 LLM 来学习如何理解人类语言,该框架也在学习生物学和化学语言。NVIDIA BioNeMo 使基于生物分子数据的大规模神经网络训练更为轻松,助力研究人员发现生物序列中的新模式并获得新洞察。研究人员可将这些洞察与生物特性或功能乃至人类健康状况联系起来。

NVIDIA BioNeMo 框架使科学家能够使用更大的数据集来训练大规模语言模型,打造出性能更强大的神经网络。NVIDIA 的 GPU 优化软件中心——NVIDIA NGC 上将提供该框架的抢先体验。

除语言模型框架之外,NVIDIA BioNeMo 还提供一项云 API 服务,该服务将支持越来越多的预训练 AI 模型。

BioNeMo 框架支持更大的模型

和更准确的预测

如今,使用自然语言处理模型来处理生物数据的科学家一般会训练相对较小、需要自定义预处理的神经网络。通过 BioNeMo,科学家可将其扩展为具有数十亿参数的 LLM,捕捉分子结构、蛋白质溶解度等信息

BioNeMo 是 NVIDIA NeMo Megatron 框架的扩展,可实现大规模自监督语言模型的 GPU 加速训练。这一针对特定领域的框架支持以 SMILES 化学结构标记表征的分子数据、以及以 FASTA 氨基酸和核酸序列字符串表征的分子数据。

OpenFold 联盟创始成员、哥伦比亚大学系统生物学系助理教授 Mohammed AlQuraishi 表示:“该框架使整个医疗和生命科学行业的研究人员都能利用快速增长的生物和化学数据集。这样就能更轻松地发现和设计出精准针对疾病分子特征的治疗方法。”

BioNeMo 服务提供用于化学和生物学的 LLM

NVIDIA BioNeMo LLM 服务将为希望快速掌握数字化的生物学和化学领域应用的 LLM 的开发者提供四个预训练语言模型。这些模型针对推理进行了优化,并将通过 NVIDIA DGX Foundry 上运行的云端 API 提供抢先体验。

ESM-1:这一最初由 Meta AI Labs 发布的蛋白质 LLM 能够处理氨基酸序列,最终生成用于预测各种蛋白质特性和功能的表征。它还提高了科学家理解蛋白质结构的能力。

OpenFold:这是由学术界和产业界共同成立的 Openfold 联盟创建的 sota 蛋白质建模工具,它将可以通过 BioNeMo 服务提供其开源 AI 工作流程。

MegaMolBART:这一基于 14 亿分子训练而成的生成式化学模型可用于反应预测、分子优化和新分子的生成。

ProtT5:该模型是在慕尼黑工业大学 RostLab 的带领下合作开发的,NVIDIA 也是该项目的参与者之一。PortT5 将 ESM-1b 等蛋白质 LLM 的功能扩展到序列生成。

未来,使用 BioNeMo LLM 服务的研究人员将能够通过 fine-tuning 以及 p-tuning 等新技术,在几小时内完成 LLM 模型的自定义,提高应用的准确性。相比原来动辄数百万个样本的数据集,p-tuning 训练方法只需要包含几百个样本的数据集。

初创企业、研究人员和制药公司

纷纷采用 NVIDIA BioNeMo

生物技术和制药行业的专家正在采用 NVIDIA BioNeMo,为新药研发提供支持。

阿斯利康和 NVIDIA 使用 Cambridge-1 超级计算机开发了 BioNeMo LLM 服务中的 MegaMolBART 模型。这家全球生物制药公司将使用 BioNeMo 框架,在涵盖小分子和蛋白质的数据集上训练一些全球最大的语言模型。该数据集日后还将涵盖 DNA。

麻省理工学院和哈佛大学旗下博德研究所的研究人员正在与 NVIDIA 一起使用 BioNeMo 框架来开发新一代 DNA 语言模型。这些模型将被整合至 Terra 中。Terra 是一个由博德研究所、微软和 Verily 共同开发的云平台,生物医学研究人员能够通过该平台,安全、大规模地共享、访问和分析数据。这些 AI 模型还将被添加到 BioNeMo 服务集中。

OpenFold 联盟计划使用 BioNeMo 框架来推进其 AI 模型开发工作。这些模型可根据氨基酸序列来预测分子结构,并达到接近实验的准确性。

Peptone 专注于构建固有无序蛋白质(缺乏稳定 3D 结构的蛋白质)的模型。该公司正与NVIDIA 一起使用同样作为 BioNeMo 基础的 NeMo 框架来开发 ESM 模型版本。该项目计划在 NVIDIA 的 Cambridge-1 超级计算机上运行,将推动 Peptone 的新药研发工作。

位于芝加哥的生物技术公司 Evozyne 将工程与深度学习技术相结合,致力于设计能够解决长期治疗和可持续发展难题的新型蛋白质。

Evozyne 联合创始人兼计算主管 Andrew Ferguson 表示:“BioNeMo 框架使我们能够在设计-构建-测试周期内,高效利用 LLM 的力量,基于数据进行蛋白质设计。这将直接影响我们新型功能性蛋白的设计,并将在人类健康和可持续发展方面得以应用。”

NVIDIA 初创加速计划成员、生物技术初创企业 Peptone 的机器学习负责人 Istvan Redl 表示:“随着大型语言模型在蛋白质领域的应用日益广泛,高效训练 LLM 并快速调整模型架构的能力变得非常重要。我们相信 BioNeMo 框架将满足可扩展性和快速实验这两大工程方面的需求。”

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4981

    浏览量

    102997
  • AI
    AI
    +关注

    关注

    87

    文章

    30763

    浏览量

    268906
  • 生物学
    +关注

    关注

    0

    文章

    26

    浏览量

    12971

原文标题:GTC22 | NVIDIA 将大型语言模型扩展到生物学领域

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    微流控技术的生物学应用

    微流控技术为在推动生物学众多领域的强大工具做出了巨大贡献。随着用于微通道中流体的注射、混合、泵送和存储的新器件和工艺的发展,近年来微流控系统在化学和生物化学中的应用越来越广泛。 尽管微流控技术近年来
    的头像 发表于 12-01 21:50 129次阅读

    NVIDIA 推出 BioNeMo 开源框架,扩大全球生物制药和科学行业的数字生物学研究规模

    阿贡国家实验室和更广泛的生物技术社群提供了一个企业级开源解决方案,使研究人员能够在本来不具备足够的计算专业知
    发表于 11-19 14:01 118次阅读
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>BioNeMo</b> 开源<b class='flag-5'>框架</b>,扩大全球<b class='flag-5'>生物</b>制药和科学行业的数字<b class='flag-5'>生物学</b><b class='flag-5'>研究</b>规模

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    的效率,还为科学研究提供了前所未有的洞察力和精确度。例如,在生物学领域,AI能够帮助科学家快速识别基因序列中的关键变异,加速新药研发进程。 2. 跨学科融合的新范式 书中强调,人工智能
    发表于 10-14 09:12

    生成式AI模型推进数字生物学发展

    Meta 的开放大语言模型(已优化并可作为 NVIDIA NIM 下载)为数字健康和生命科学工作流提供动力支持。
    的头像 发表于 09-13 17:18 579次阅读

    ADI与与生物平台创新公司Flagship Pioneering达成战略合作

    与Flagship Pioneering在应用生物学领域的专长,共同推动生物学见解的发掘以及全新及增强的测量、诊断与新型干预措施。此次合作为双方带来了难得的机遇,旨在共创面向人类健康与可持续发展的突破性解决方案。
    的头像 发表于 07-29 10:38 751次阅读

    NVIDIA Omniverse 将为全新 OpenPBR 材质模型提供原生支持

    、组合、模拟和协作的可扩展框架和生态系统,OpenUSD 使开发者能够构建可互操作的 3D 工作流,开启了工业数字化的新时代。 此外,NVIDIA Omniverse 还将为全新 OpenPBR 材质模型
    的头像 发表于 06-14 11:23 626次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse <b class='flag-5'>将为</b>全新 OpenPBR 材质模型<b class='flag-5'>提供</b>原生支持

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNI
    的头像 发表于 05-29 09:22 486次阅读

    合成生物是什么-微流控芯片技术在合成生物学的应用前景

    合成生物其实就是一种“造物”的技术。它融合了生物学、化学和工程等多种技术,以可再生生物质为原料,以生物体作
    的头像 发表于 05-28 13:58 749次阅读
    合成<b class='flag-5'>生物</b>是什么-微流控芯片技术在合成<b class='flag-5'>生物学</b>的应用前景

    助力科学发展,NVIDIA AI加速HPC研究

    科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传和材料科学领域的 HPC 工作。
    的头像 发表于 05-14 09:17 409次阅读
    助力科学发展,<b class='flag-5'>NVIDIA</b> AI<b class='flag-5'>加速</b>HPC<b class='flag-5'>研究</b>

    三郡科技:电化学生物传感器电极与生物芯片的异同

    电化学生物传感器电极 与 生物芯片 作为生物技术领域中的两大重要工具,为现代生物分析和医学诊断提供了强有力的支持。虽然它们都涉及
    的头像 发表于 04-28 14:08 776次阅读
    三郡科技:电化学<b class='flag-5'>生物</b>传感器电极与<b class='flag-5'>生物</b>芯片的异同

    Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计

    中国上海,2024 年 3 月 25 日——楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布,公司将深化与 NVIDIA 在 EDA、系统设计与分析、数字生物学和人工智能领域的多年合作,推出两款变革性解决方案,利用
    的头像 发表于 03-25 14:36 605次阅读

    基于NVIDIA开源CUDA-Q量子计算平台发布

    NVIDIA 于太平洋时间 3 月 18 日推出一项云服务,旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算研究中取得突破。
    的头像 发表于 03-21 09:54 430次阅读

    NVIDIA 推出云量子计算机模拟微服务

    —— 太平洋时间 2024 年 3 月 18 日 —— NVIDIA 于今日推出一项云服务,旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算研究中取得突破。
    发表于 03-19 11:27 439次阅读
    <b class='flag-5'>NVIDIA</b> 推出云量子计算机模拟微服务

    NVIDIA生成式AI开启药物研发与设计的新纪元

    NVIDIA BioNeMo 现已提供十余个生成式 AI 模型以及云服务,正在推动计算机辅助药物发现生态系统的发展。
    的头像 发表于 01-10 16:00 528次阅读
    <b class='flag-5'>NVIDIA</b>生成式AI开启药物研发与设计的新纪元

    新技术在生物样本冷冻中的应用案例分析

    推动生物学研究进展   新技术的应用为生物学研究提供了更加高效和可靠的样本冷冻处理方法,推动了相关领域的
    发表于 12-26 13:30