0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-09-06 14:59 次阅读

Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列,该系列包含最先进的指导和奖励模型,以及一个用于生成式 AI 训练的数据集。

NVIDIA 于近日发布Nemotron-4 340B。开发者可以使用这组开源模型生成用于训练大语言模型(LLM)的合成数据,训练出的 LLM 可用于医疗、金融、制造、零售等各个行业的商业应用。

高质量的训练数据对于自定义 LLM 的性能、准确性和回答质量来说至关重要,但强大的数据集通常非常昂贵且难以获得。

通过独树一帜的开源模型许可证,Nemotron-4 340B 为开发者提供了一种免费、可扩展的合成数据生成方法,帮助他们构建强大的 LLM。

Nemotron-4 340B 系列包含基础模型、指导模型和奖励模型,由它们组成的流水线能够生成用于训练和完善 LLM 的合成数据。为了能够与NVIDIA NeMo协同工作,这些模型专门进行了优化。NVIDIA NeMo 是一个适用于端到端模型训练的开源框架,涵盖数据管护、定制、评估等步骤。该系列模型还针对开源NVIDIA TensorRT-LLM库的推理进行了优化。

Nemotron-4 340B 现已可以从NVIDIA NGC目录和 Hugging Face 下载。开发者很快就能在 ai.nvidia.com 上访问这些模型,它们将被打包成带有标准应用编程接口的NVIDIA NIM微服务,可在任意位置进行部署。

将 Nemotron 用于生成合成数据

在难以获得大型多样化标记数据集的情况下,这些 LLM 可以帮助开发者生成合成训练数据。

Nemotron-4 340B Instruct模型可生成各种模拟现实世界数据特征的合成数据,通过提高数据质量,增强自定义 LLM 在各个领域的性能和稳健性。

随后,为了提高 AI 生成数据的质量,开发者可以使用Nemotron-4 340B Reward模型来筛选高质量的回答。Nemotron-4 340B Reward 模型根据五个方面对回答进行评分,这五个方面分别是:有用性、正确性、连贯性、复杂性和冗长性。该模型目前在 AI2 专为评估奖励模型能力、安全性和缺陷而创建的“Hugging Face RewardBench 排行榜”上排名第一。

wKgZombaqFaAYqNYAAEgri7KFqc769.jpg

在这个合成数据生成流水线中,(1)Nemotron-4 340B Instruct 模型首先生成基于文本的合成输出。然后来到评估模型,

(2)Nemotron-4 340B Reward 模型对生成的文本进行评估,并提供指导反复改进的反馈,确保合成数据准确、相关且符合特定要求。

研究者还可以使用自己的专有数据,并结合随附的HelpSteer2 数据集自定义 Nemotron-4 340B Base 模型,创造出自己的指导或奖励模型。

使用 NeMo 进行微调

并使用 TensorRT-LLM 优化推理

开发者可以使用开源的 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 提高其指导和奖励模型的效率,以便生成合成数据并对回答进行评分。

所有 Nemotron-4 340B 模型均使用 TensorRT-LLM 优化,能够利用张量并行性,这是一种模型并行技术,通过将单个权重矩阵分割到多个 GPU 和服务器上,实现大规模的高效推理。

Nemotron-4 340B Base在 9 万亿个 token 上训练而成。可使用 NeMo 框架对它进行自定义,使其适应特定的用例或领域。这一微调过程得益于大量的预训练数据,使模型能够针对特定的下游任务提供更加准确的输出。

NeMo 框架提供多种自定义方法,包括有监督的微调和各种参数高效微调方法,比如低秩自适应(LoRA)。

为了提升模型质量,开发者可以使用NeMo Aligner以及由 Nemotron-4 340B Reward 模型注释的数据集对齐模型。校准是 LLM 训练过程中的一个关键步骤。在该步骤中,模型的行为通过人类反馈强化学习(RLHF)等算法进行微调,以保证其输出结果安全、准确、符合上下文并与其预期目标一致。

寻求企业级支持和生产环境安全性的企业也可以通过NVIDIA AI Enterprise云原生软件平台访问 NeMo 和 TensorRT-LLM。该平台为生成式 AI 基础模型提供更加快速和高效的运行时。

评估模型安全性并开始使用

Nemotron-4 340B Instruct 模型经过包括对抗测试在内的大量安全性评估,其各项风险指标均表现良好。但用户仍应对该模型的输出结果进行仔细评估,确保合成生成的数据适合且安全而准确地用于自己的用例。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4792

    浏览量

    102414
  • 模型
    +关注

    关注

    1

    文章

    3028

    浏览量

    48331
  • LLM
    LLM
    +关注

    关注

    0

    文章

    247

    浏览量

    278

原文标题:NVIDIA 发布适用于训练大语言模型的开源合成数据生成流水线

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405BNVIDIA Nemotron
    发表于 07-24 09:39 617次阅读
    <b class='flag-5'>NVIDIA</b> AI Foundry 为全球企业打造自定义 Llama 3.1 <b class='flag-5'>生成</b>式 AI <b class='flag-5'>模型</b>

    在Ubuntu上使用Nvidia GPU训练模型

    问题最近在Ubuntu上使用Nvidia GPU训练模型的时候,没有问题,过一会再训练出现非常卡顿,使用nvidia-smi查看发现,显示G
    发表于 01-03 08:24

    2021 OPPO开发者大会:NLP预训练模型

    2021 OPPO开发者大会:NLP预训练模型 2021 OPPO开发者大会上介绍了融合知识的NLP预训练
    的头像 发表于 10-27 14:18 1656次阅读
    2021 OPPO<b class='flag-5'>开发者</b>大会:NLP预<b class='flag-5'>训练</b>大<b class='flag-5'>模型</b>

    2021年OPPO开发者大会 融合知识的NLP预训练模型

    2021年OPPO开发者大会刘海锋:融合知识的NLP预训练模型,知识融合学习运用在小布助手里面。
    的头像 发表于 10-27 14:48 2370次阅读
    2021年OPPO<b class='flag-5'>开发者</b>大会 融合知识的NLP预<b class='flag-5'>训练</b>大<b class='flag-5'>模型</b>

    NVIDIA提供用于AI训练合成数据生成工具

    提供合成数据生成工具和服务的企业以及开发者现在可以使用 Omniverse Replicator SDK 构建自定义、物理级精确的合成数据生成
    的头像 发表于 07-03 10:06 1664次阅读

    NVIDIA NeMo最新语言模型服务帮助开发者定制大规模语言模型

    NVIDIA NeMo 大型语言模型(LLM)服务帮助开发者定制大规模语言模型NVIDIA B
    发表于 09-22 10:42 858次阅读

    一文看懂 DRIVE Replicator:合成数据生成加速自动驾驶汽车的开发和验证

    在长尾场景训练的最新进展和相关经验,特别是探讨开发者如何使用 DRIVE Replicator 生成多样化的合成数据集,以及准确的真值数据
    的头像 发表于 11-10 11:00 518次阅读

    使用 NVIDIA TAO 工具套件和预训练模型加快 AI 开发

    可以访问预训练模型的完整源代码和模型权重。 该工具套件能够高效训练视觉和对话式 AI 模型。由于简化了复杂的 AI
    的头像 发表于 12-15 19:40 902次阅读

    Rendered.ai 将 NVIDIA Omniverse 集成到其合成数据生成平台

    合成数据生成(SDG)平台即服务(PaaS)为开发者数据科学家等人员简化 AI 训练训练
    的头像 发表于 07-12 19:10 439次阅读
    Rendered.ai 将 <b class='flag-5'>NVIDIA</b> Omniverse 集成到其<b class='flag-5'>合成数据</b><b class='flag-5'>生成</b>平台

    NVIDIA 与 Hugging Face 将连接数百万开发者生成式 AI 超级计算

    8 月 8 日 — NVIDIA 与 Hugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成式 AI 超级计算服务,帮助他们构建大语言
    发表于 08-09 11:41 166次阅读
    <b class='flag-5'>NVIDIA</b> 与 Hugging Face 将连接数百万<b class='flag-5'>开发者</b>与<b class='flag-5'>生成</b>式 AI 超级计算

    NVIDIA 加快企业自定义生成式 AI 模型开发

    的业务数据进行自定义。 如今,免费、开源的大语言模型对企业来说就像是一顿“自助餐”。但对于构建自定义生成式 AI 应用的开发者来说,这顿“大餐”可能会让他们应接不暇,因为他们需要满足各
    的头像 发表于 11-16 21:15 487次阅读
    <b class='flag-5'>NVIDIA</b> 加快企业自定义<b class='flag-5'>生成</b>式 AI <b class='flag-5'>模型</b><b class='flag-5'>开发</b>

    NVIDIA 为部分大型亚马逊 Titan 基础模型提供训练支持

    GPU 和海量的数据集上所训练而成。 不过这可能会给想要使用生成式 AI 的企业带来很多巨大的挑战。 NVIDIA NeMo (一个用于构建、自定义和运行 LLM 的框架)能够
    的头像 发表于 11-29 21:15 455次阅读
    <b class='flag-5'>NVIDIA</b> 为部分大型亚马逊 Titan 基础<b class='flag-5'>模型</b>提供<b class='flag-5'>训练</b>支持

    NVIDIA NIM 革命性地改变模型部署,将全球数百万开发者转变为生成式 AI 开发者

    部署在云、数据中心或工作站上。借助 NVIDIA NIM,开发者能够轻松地为 copilots、聊天机器人等构建生成式 AI 应用,所需时间从
    发表于 06-03 09:12 179次阅读
    <b class='flag-5'>NVIDIA</b> NIM 革命性地改变<b class='flag-5'>模型</b>部署,将全球数百万<b class='flag-5'>开发者</b>转变为<b class='flag-5'>生成</b>式 AI <b class='flag-5'>开发者</b>

    NVIDIA将全球数百万开发者转变为生成式 AI 开发者

    和测试   NVIDIA 于今日宣布,全球 2,800 万开发者现可下载NVIDIA NIM——一种推理微服务,通过经优化的容器的形式提供模型——以部署在云、
    的头像 发表于 06-03 18:21 896次阅读

    英伟达开源Nemotron-4 340B系列模型,助力大型语言模型训练

    近日,英伟达宣布开源了一款名为Nemotron-4 340B的大型模型,这一壮举为开发者们打开了通往高性能大型语言模型(LLM)
    的头像 发表于 06-17 14:53 419次阅读