NVIDIA BioNeMo框架将为生物学研究提供加速-电子发烧友网

领先的制药公司、生物技术初创企业和前沿生物研究人员正在使用 NVIDIA BioNeMo LLM 服务和框架来开发用于生成、预测和理解生物分子数据的 AI 应用。

科学家们致力于探索 DNA、蛋白质和其他生命体的“基础构建”，以期获得全新的洞察，而今日在 NVIDIA GTC 上发布的 NVIDIA BioNeMo 框架将为其研究提供加速。

NVIDIA BioNeMo 框架用于训练和部署超算规模的大型生物分子语言模型，帮助科学家更好地了解疾病，并为患者找到治疗方法。该大型语言模型（LLM）框架将支持化学、蛋白质、DNA 和 RNA 数据格式。

NVIDIA BioNeMo 是 NVIDIA Clara Discovery 药物研发框架、应用和 AI 模型集的一部分。

正如 AI 通过 LLM 来学习如何理解人类语言，该框架也在学习生物学和化学语言。NVIDIA BioNeMo 使基于生物分子数据的大规模神经网络训练更为轻松，助力研究人员发现生物序列中的新模式并获得新洞察。研究人员可将这些洞察与生物特性或功能乃至人类健康状况联系起来。

NVIDIA BioNeMo 框架使科学家能够使用更大的数据集来训练大规模语言模型，打造出性能更强大的神经网络。NVIDIA 的 GPU 优化软件中心——NVIDIA NGC 上将提供该框架的抢先体验。

除语言模型框架之外，NVIDIA BioNeMo 还提供一项云 API 服务，该服务将支持越来越多的预训练 AI 模型。

BioNeMo 框架支持更大的模型

和更准确的预测

如今，使用自然语言处理模型来处理生物数据的科学家一般会训练相对较小、需要自定义预处理的神经网络。通过 BioNeMo，科学家可将其扩展为具有数十亿参数的 LLM，捕捉分子结构、蛋白质溶解度等信息。

BioNeMo 是 NVIDIA NeMo Megatron 框架的扩展，可实现大规模自监督语言模型的 GPU 加速训练。这一针对特定领域的框架支持以 SMILES 化学结构标记表征的分子数据、以及以 FASTA 氨基酸和核酸序列字符串表征的分子数据。

OpenFold 联盟创始成员、哥伦比亚大学系统生物学系助理教授 Mohammed AlQuraishi 表示：“该框架使整个医疗和生命科学行业的研究人员都能利用快速增长的生物和化学数据集。这样就能更轻松地发现和设计出精准针对疾病分子特征的治疗方法。”

BioNeMo 服务提供用于化学和生物学的 LLM

NVIDIA BioNeMo LLM 服务将为希望快速掌握数字化的生物学和化学领域应用的 LLM 的开发者提供四个预训练语言模型。这些模型针对推理进行了优化，并将通过 NVIDIA DGX Foundry 上运行的云端 API 提供抢先体验。

ESM-1：这一最初由 Meta AI Labs 发布的蛋白质 LLM 能够处理氨基酸序列，最终生成用于预测各种蛋白质特性和功能的表征。它还提高了科学家理解蛋白质结构的能力。

OpenFold：这是由学术界和产业界共同成立的 Openfold 联盟创建的 sota 蛋白质建模工具，它将可以通过 BioNeMo 服务提供其开源 AI 工作流程。

MegaMolBART：这一基于 14 亿分子训练而成的生成式化学模型可用于反应预测、分子优化和新分子的生成。

ProtT5：该模型是在慕尼黑工业大学 RostLab 的带领下合作开发的，NVIDIA 也是该项目的参与者之一。PortT5 将 ESM-1b 等蛋白质 LLM 的功能扩展到序列生成。

未来，使用 BioNeMo LLM 服务的研究人员将能够通过 fine-tuning 以及 p-tuning 等新技术，在几小时内完成 LLM 模型的自定义，提高应用的准确性。相比原来动辄数百万个样本的数据集，p-tuning 训练方法只需要包含几百个样本的数据集。

初创企业、研究人员和制药公司

纷纷采用 NVIDIA BioNeMo

生物技术和制药行业的专家正在采用 NVIDIA BioNeMo，为新药研发提供支持。

阿斯利康和 NVIDIA 使用 Cambridge-1 超级计算机开发了 BioNeMo LLM 服务中的 MegaMolBART 模型。这家全球生物制药公司将使用 BioNeMo 框架，在涵盖小分子和蛋白质的数据集上训练一些全球最大的语言模型。该数据集日后还将涵盖 DNA。

麻省理工学院和哈佛大学旗下博德研究所的研究人员正在与 NVIDIA 一起使用 BioNeMo 框架来开发新一代 DNA 语言模型。这些模型将被整合至 Terra 中。Terra 是一个由博德研究所、微软和 Verily 共同开发的云平台，生物医学研究人员能够通过该平台，安全、大规模地共享、访问和分析数据。这些 AI 模型还将被添加到 BioNeMo 服务集中。

OpenFold 联盟计划使用 BioNeMo 框架来推进其 AI 模型开发工作。这些模型可根据氨基酸序列来预测分子结构，并达到接近实验的准确性。

Peptone 专注于构建固有无序蛋白质（缺乏稳定 3D 结构的蛋白质）的模型。该公司正与NVIDIA 一起使用同样作为 BioNeMo 基础的 NeMo 框架来开发 ESM 模型版本。该项目计划在 NVIDIA 的 Cambridge-1 超级计算机上运行，将推动 Peptone 的新药研发工作。

位于芝加哥的生物技术公司 Evozyne 将工程与深度学习技术相结合，致力于设计能够解决长期治疗和可持续发展难题的新型蛋白质。

Evozyne 联合创始人兼计算主管 Andrew Ferguson 表示：“BioNeMo 框架使我们能够在设计-构建-测试周期内，高效利用 LLM 的力量，基于数据进行蛋白质设计。这将直接影响我们新型功能性蛋白的设计，并将在人类健康和可持续发展方面得以应用。”

NVIDIA 初创加速计划成员、生物技术初创企业 Peptone 的机器学习负责人 Istvan Redl 表示：“随着大型语言模型在蛋白质领域的应用日益广泛，高效训练 LLM 并快速调整模型架构的能力变得非常重要。我们相信 BioNeMo 框架将满足可扩展性和快速实验这两大工程方面的需求。”

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5098

浏览量
104217
AI

AI

+关注

关注
87

文章
32172

浏览量
271142
生物学

生物学

+关注

关注
0

文章
26

浏览量
13006

原文标题：GTC22 | NVIDIA 将大型语言模型扩展到生物学领域

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

利用NVIDIA DPF引领DPU加速云计算的未来

越来越多的企业开始采用加速计算，从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架（DPF)，该框架提供

发表于 01-24 09:29 •283次阅读

微流控技术的生物学应用

微流控技术为在推动生物学众多领域的强大工具做出了巨大贡献。随着用于微通道中流体的注射、混合、泵送和存储的新器件和工艺的发展，近年来微流控系统在化学和生物化学中的应用越来越广泛。尽管微流控技术近年来

发表于 12-01 21:50 •250次阅读

生物传感器：科技前沿的生物监测利器

和品质。生物学研究：生物传感器可用于细胞信号传导、蛋白质相互作用等生物过程的研究，为生物学家

发表于 11-20 15:12 •1910次阅读

NVIDIA 推出 BioNeMo 开源框架，扩大全球生物制药和科学行业的数字生物学研究规模

阿贡国家实验室和更广泛的生物技术社群提供了一个企业级开源解决方案，使研究人员能够在本来不具备足够的计算专业知

发表于 11-19 14:01 •214次阅读

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

的效率，还为科学研究提供了前所未有的洞察力和精确度。例如，在生物学领域，AI能够帮助科学家快速识别基因序列中的关键变异，加速新药研发进程。 2. 跨学科融合的新范式书中强调，人工智能

发表于 10-14 09:12

生成式AI模型推进数字生物学发展

Meta 的开放大语言模型（已优化并可作为 NVIDIA NIM 下载）为数字健康和生命科学工作流提供动力支持。

发表于 09-13 17:18 •737次阅读

ADI与与生物平台创新公司Flagship Pioneering达成战略合作

与Flagship Pioneering在应用生物学领域的专长，共同推动生物学见解的发掘以及全新及增强的测量、诊断与新型干预措施。此次合作为双方带来了难得的机遇，旨在共创面向人类健康与可持续发展的突破性解决方案。

发表于 07-29 10:38 •863次阅读

NVIDIA Omniverse 将为全新 OpenPBR 材质模型提供原生支持

、组合、模拟和协作的可扩展框架和生态系统，OpenUSD 使开发者能够构建可互操作的 3D 工作流，开启了工业数字化的新时代。此外，NVIDIA Omniverse 还将为全新 OpenPBR 材质模型

发表于 06-14 11:23 •745次阅读

借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API，以便为 NVIDIA BlueField DPU 和 SuperNI

发表于 05-29 09:22 •585次阅读

合成生物是什么-微流控芯片技术在合成生物学的应用前景

合成生物其实就是一种“造物”的技术。它融合了生物学、化学和工程学等多种技术，以可再生生物质为原料，以生物体作

发表于 05-28 13:58 •939次阅读

助力科学发展，NVIDIA AI加速HPC研究

科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作。

发表于 05-14 09:17 •499次阅读

三郡科技：电化学生物传感器电极与生物芯片的异同

电化学生物传感器电极与生物芯片作为生物技术领域中的两大重要工具，为现代生物分析和医学诊断提供了强有力的支持。虽然它们都涉及

发表于 04-28 14:08 •990次阅读

Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计

中国上海，2024 年 3 月 25 日——楷登电子（美国 Cadence 公司，NASDAQ：CDNS）近日宣布，公司将深化与 NVIDIA 在 EDA、系统设计与分析、数字生物学和人工智能领域的多年合作，推出两款变革性解决方案，利用

发表于 03-25 14:36 •728次阅读

基于NVIDIA开源CUDA-Q量子计算平台发布

NVIDIA 于太平洋时间 3 月 18 日推出一项云服务，旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算研究中取得突破。

发表于 03-21 09:54 •515次阅读

NVIDIA 推出云量子计算机模拟微服务

—— 太平洋时间 2024 年 3 月 18 日 —— NVIDIA 于今日推出一项云服务，旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算研究中取得突破。

发表于 03-19 11:27 •519次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

NVIDIA BioNeMo框架将为生物学研究提供加速

评论

利用NVIDIA DPF引领DPU加速云计算的未来

微流控技术的生物学应用

生物传感器：科技前沿的生物监测利器

NVIDIA 推出 BioNeMo 开源框架，扩大全球生物制药和科学行业的数字生物学研究规模

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

生成式AI模型推进数字生物学发展

ADI与与生物平台创新公司Flagship Pioneering达成战略合作

NVIDIA Omniverse 将为全新 OpenPBR 材质模型提供原生支持

借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

合成生物是什么-微流控芯片技术在合成生物学的应用前景

助力科学发展，NVIDIA AI加速HPC研究

三郡科技：电化学生物传感器电极与生物芯片的异同

Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计

基于NVIDIA开源CUDA-Q量子计算平台发布

NVIDIA 推出云量子计算机模拟微服务