NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据-电子发烧友网

Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列，该系列包含最先进的指导和奖励模型，以及一个用于生成式 AI 训练的数据集。

NVIDIA 于近日发布Nemotron-4 340B。开发者可以使用这组开源模型生成用于训练大语言模型（LLM）的合成数据，训练出的 LLM 可用于医疗、金融、制造、零售等各个行业的商业应用。

高质量的训练数据对于自定义 LLM 的性能、准确性和回答质量来说至关重要，但强大的数据集通常非常昂贵且难以获得。

通过独树一帜的开源模型许可证，Nemotron-4 340B 为开发者提供了一种免费、可扩展的合成数据生成方法，帮助他们构建强大的 LLM。

Nemotron-4 340B 系列包含基础模型、指导模型和奖励模型，由它们组成的流水线能够生成用于训练和完善 LLM 的合成数据。为了能够与NVIDIA NeMo协同工作，这些模型专门进行了优化。NVIDIA NeMo 是一个适用于端到端模型训练的开源框架，涵盖数据管护、定制、评估等步骤。该系列模型还针对开源NVIDIA TensorRT-LLM库的推理进行了优化。

Nemotron-4 340B 现已可以从NVIDIA NGC目录和 Hugging Face 下载。开发者很快就能在 ai.nvidia.com 上访问这些模型，它们将被打包成带有标准应用编程接口的NVIDIA NIM微服务，可在任意位置进行部署。

将 Nemotron 用于生成合成数据

在难以获得大型多样化标记数据集的情况下，这些 LLM 可以帮助开发者生成合成训练数据。

Nemotron-4 340B Instruct模型可生成各种模拟现实世界数据特征的合成数据，通过提高数据质量，增强自定义 LLM 在各个领域的性能和稳健性。

随后，为了提高 AI 生成数据的质量，开发者可以使用Nemotron-4 340B Reward模型来筛选高质量的回答。Nemotron-4 340B Reward 模型根据五个方面对回答进行评分，这五个方面分别是：有用性、正确性、连贯性、复杂性和冗长性。该模型目前在 AI2 专为评估奖励模型能力、安全性和缺陷而创建的“Hugging Face RewardBench 排行榜”上排名第一。

在这个合成数据生成流水线中，（1）Nemotron-4 340B Instruct 模型首先生成基于文本的合成输出。然后来到评估模型，

（2）Nemotron-4 340B Reward 模型对生成的文本进行评估，并提供指导反复改进的反馈，确保合成数据准确、相关且符合特定要求。

研究者还可以使用自己的专有数据，并结合随附的HelpSteer2 数据集自定义 Nemotron-4 340B Base 模型，创造出自己的指导或奖励模型。

使用 NeMo 进行微调

并使用 TensorRT-LLM 优化推理

开发者可以使用开源的 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 提高其指导和奖励模型的效率，以便生成合成数据并对回答进行评分。

所有 Nemotron-4 340B 模型均使用 TensorRT-LLM 优化，能够利用张量并行性，这是一种模型并行技术，通过将单个权重矩阵分割到多个 GPU 和服务器上，实现大规模的高效推理。

Nemotron-4 340B Base在 9 万亿个 token 上训练而成。可使用 NeMo 框架对它进行自定义，使其适应特定的用例或领域。这一微调过程得益于大量的预训练数据，使模型能够针对特定的下游任务提供更加准确的输出。

NeMo 框架提供多种自定义方法，包括有监督的微调和各种参数高效微调方法，比如低秩自适应（LoRA）。

为了提升模型质量，开发者可以使用NeMo Aligner以及由 Nemotron-4 340B Reward 模型注释的数据集对齐模型。校准是 LLM 训练过程中的一个关键步骤。在该步骤中，模型的行为通过人类反馈强化学习（RLHF）等算法进行微调，以保证其输出结果安全、准确、符合上下文并与其预期目标一致。

寻求企业级支持和生产环境安全性的企业也可以通过NVIDIA AI Enterprise云原生软件平台访问 NeMo 和 TensorRT-LLM。该平台为生成式 AI 基础模型提供更加快速和高效的运行时。

评估模型安全性并开始使用

Nemotron-4 340B Instruct 模型经过包括对抗测试在内的大量安全性评估，其各项风险指标均表现良好。但用户仍应对该模型的输出结果进行仔细评估，确保合成生成的数据适合且安全而准确地用于自己的用例。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5107

浏览量
104460
模型

模型

+关注

关注
1

文章
3415

浏览量
49475
LLM

LLM

+关注

关注
1

文章
308

浏览量
511

原文标题：NVIDIA 发布适用于训练大语言模型的开源合成数据生成流水线

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

借助 NVIDIA AI Foundry，企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron

发表于 07-24 09:39 •778次阅读

<b class='flag-5'>NVIDIA</b> AI Foundry 为全球企业打造自定义 Llama 3.1 <b class='flag-5'>生成</b>式 AI <b class='flag-5'>模型</b>

2021 OPPO开发者大会：NLP预训练大模型

2021 OPPO开发者大会：NLP预训练大模型 2021 OPPO开发者大会上介绍了融合知识的NLP预训练大

发表于 10-27 14:18 •1831次阅读

2021 OPPO<b class='flag-5'>开发者</b>大会：NLP预<b class='flag-5'>训练</b>大<b class='flag-5'>模型</b>

NVIDIA提供用于AI训练的合成数据生成工具

提供合成数据生成工具和服务的企业以及开发者现在可以使用 Omniverse Replicator SDK 构建自定义、物理级精确的合成数据生成

发表于 07-03 10:06 •1856次阅读

NVIDIA NeMo最新语言模型服务帮助开发者定制大规模语言模型

NVIDIA NeMo 大型语言模型（LLM）服务帮助开发者定制大规模语言模型；NVIDIA B

发表于 09-22 10:42 •970次阅读

一文看懂 DRIVE Replicator：合成数据生成加速自动驾驶汽车的开发和验证

在长尾场景训练的最新进展和相关经验，特别是探讨开发者如何使用 DRIVE Replicator 生成多样化的合成数据集，以及准确的真值数据标

发表于 11-10 11:00 •704次阅读

使用 NVIDIA TAO 工具套件和预训练模型加快 AI 开发

可以访问预训练模型的完整源代码和模型权重。该工具套件能够高效训练视觉和对话式 AI 模型。由于简化了复杂的 AI

发表于 12-15 19:40 •1127次阅读

Rendered.ai 将 NVIDIA Omniverse 集成到其合成数据生成平台

合成数据生成（SDG）平台即服务（PaaS）为开发者、数据科学家等人员简化 AI 训练。训练计

发表于 07-12 19:10 •635次阅读

NVIDIA 与 Hugging Face 将连接数百万开发者与生成式 AI 超级计算

8 月 8 日 — NVIDIA 与 Hugging Face 宣布建立合作伙伴关系，为数百万开发者提供生成式 AI 超级计算服务，帮助他们构建大语言

发表于 08-09 11:41 •244次阅读

NVIDIA 加快企业自定义生成式 AI 模型开发

的业务数据进行自定义。如今，免费、开源的大语言模型对企业来说就像是一顿“自助餐”。但对于构建自定义生成式 AI 应用的开发者来说，这顿“大餐”可能会让他们应接不暇，因为他们需要满足各

发表于 11-16 21:15 •684次阅读

NVIDIA 为部分大型亚马逊 Titan 基础模型提供训练支持

GPU 和海量的数据集上所训练而成。不过这可能会给想要使用生成式 AI 的企业带来很多巨大的挑战。 NVIDIA NeMo （一个用于构建、自定义和运行 LLM 的框架）能够

发表于 11-29 21:15 •615次阅读

NVIDIA NIM 革命性地改变模型部署，将全球数百万开发者转变为生成式 AI 开发者

部署在云、数据中心或工作站上。借助 NVIDIA NIM，开发者能够轻松地为 copilots、聊天机器人等构建生成式 AI 应用，所需时间从

发表于 06-03 09:12 •289次阅读

NVIDIA将全球数百万开发者转变为生成式 AI 开发者

和测试 NVIDIA 于今日宣布，全球 2,800 万开发者现可下载NVIDIA NIM——一种推理微服务，通过经优化的容器的形式提供模型——以部署在云、

发表于 06-03 18:21 •1117次阅读

英伟达开源Nemotron-4 340B系列模型，助力大型语言模型训练

近日，英伟达宣布开源了一款名为Nemotron-4 340B的大型模型，这一壮举为开发者们打开了通往高性能大型语言模型（LLM）

发表于 06-17 14:53 •695次阅读

NVIDIA推出开放式Llama Nemotron系列模型

作为 NVIDIA NIM 微服务，开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何

发表于 01-09 11:11 •343次阅读

英伟达推出基石世界模型Cosmos,解决智驾与机器人具身智能训练数据问题

。Cosmos 世界基础模型（WFM）使开发者能够轻松生成大量基于物理学的逼真合成数据，以用于训练和评估其现有的

发表于 01-14 11:04 •422次阅读