0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用 NVIDIA AI Foundation Models 构建自定义企业级生成式 AI

NVIDIA英伟达企业解决方案 来源:未知 2023-11-17 21:30 次阅读
wKgaomVXbAeAcNF2AADs9hQoRuI274.jpg

在生成式 AI 领域,构建企业级大语言模型(LLM)需要具备采集高质量数据、设置加速基础设施和优化模型方面的专业知识。

开发者可以从预训练模型开始,根据自己的用例对模型进行微调,从而节省时间并使其解决方案更快地投入市场。开发者需要一种简单的方法来试用模型,并通过 API 集成这些模型来评估其能力。这有助于他们确定哪种模型最适合其应用。

NVIDIA AI Foundation Models

NVIDIA AI Foundation Models是由精心挑选的社区模型和 NVIDIA 构建的模型组成,并针对峰值性能进行了优化。开发者可以通过 API 或图形用户界面直接在浏览器中快速使用这些模型,无需进行任何设置。这些模型通过NVIDIA TensorRT-LLM和激活感知权重量化(AWQ)技术进行优化,以便确定最高吞吐量和最低延迟的配置,并且在 NVIDIA 加速计算堆栈上大规模运行。

NVIDIA Nemotron-3 8B 系列 LLM 介绍

NVIDIA Nemotron-3 8B系列模型为想要构建生产就绪生成式 AI 应用的客户提供了基础。这些模型是基于可靠的数据集构建,其运行性能可媲美规模远超它们的模型,因此非常适合企业部署。

NVIDIA Nemotron-3 8B 系列模型的一大关键优势在于其具有多语言功能,这使其成为全球企业的理想选择。这些模型精通 53 种语言,包括英语、德语、俄语、西班牙语、法语、日语、中文、意大利语和荷兰语。

该系列模型还采用了一系列对齐技术,包括监督微调(SFT)、人类反馈强化学习(RLHF)以及全新的NVIDIA SteerLM定制化技术,使客户可以在推理时调整模型。无论是自定义模型还是从头开始运行模型,这些变体为支持各种不同的用例打下了基础。

Nemotron-3 8B 系列模型包含:

  • Nemotron-3-8B-Chat-SteerLM:一个基于 NV-Nemotron-3-8B 基本模型的生成式语言模型,专为在推理过程中使用户能够采用 SteerLM 技术控制模型输出而定制。

  • Nemotron-3-8B-QA:一个基于 NV-Nemotron-3-8B 基础模型的生成式语言模型,可针对问题回答指令进行进一步微调。

经过 NVIDIA 优化的社区模型

此外,NVIDIA 还提供领先的社区模型,这些模型均经过 NVIDIA TensorRT-LLM 的优化,具有最高的性价比,企业机构可根据企业应用对它们进行自定义。这些模型包括:

  • Llama 2:最流行的 LLM 之一,能够根据提示生成文本。

  • Stable Diffusion XL:一种热门的生成式 AI 模型,可使用文本创建富有表现力的图像。

  • Code Llama:Llama 2 模型的微调版本,可使用 JavaC++Python 等多种流行语言生成代码。

  • Mistral 7B:一种能遵循指令、完成请求并生成有创意的文本格式的 LLM。

  • Contrastive Language-Image Pre-Training (CLIP):一种流行的开源模型,能同时理解图像和文本,从而完成图像分类、物体检测等任务。

当开发者确定了合适的基础模型后,就可以轻松地对这些模型进行微调和部署,无论是在自己的基础设施上,还是通过NVIDIA DGX Cloud在 NVIDIA 维护的基础设施上。

下面让我们一起体验、定制和部署微调后的 Llama 2 模型。

体验 Llama 2

NVIDIA 提供了一个易于使用的界面,使开发者能够直接在浏览器上与 Llama 2 模型进行交互。只需在提示字段中输入文本并点击生成,模型就会立即开始生成信息回复。

在图 1 中,用户要求模型进行 SQL 查询,检索 2021 年第一季度至少消费 50,000 美元的客户名单。模型不但正确理解了用户的查询,并提供了答案和详细解释。

wKgaomVXbAeASNiOAAHfhVJza_w002.png

图 1. Llama 2 模型对 SQL 查询“获取 2021 年第一季度

至少消费 50,000 美元的客户名单”所做出的响应

而开发者通常对代码更感兴趣。因此,NVIDIA 也直接在浏览器中提供了一个 API 小工具,让用户可以通过 API 无缝体验这些模型。

如要试用这个浏览器内置的 API,请单击 API 模式,然后从下拉菜单中选择您倾向的语言。图 2 显示了通过 cURL 调用该 API 的 API 指令。

wKgaomVXbAeAfx5VAAJT5xM-gms898.png

图 2. 用于体验 Llama 2 模型的

浏览器内置 API 小工具(cURL 语言)

自定义模型

通常情况下,一般模型无法满足开发者的需求,必须使用专有数据进行微调。因此,NVIDIA 提供了多种自定义可用模型的途径。

NVIDIA NeMo是一个端到端企业级云原生框架,开发者可用它来构建、定制和部署具有数十亿参数的生成式 AI 模型。此外,NeMo 还提供用于微调 LLM(如 Llama)的 API。

为了快速上手,我们也提供了一个 NVIDIA LaunchPad 实验室。这个通用的试验场可对最新的 NVIDIA 企业级软硬件进行全方位测试。

该 LaunchPad 实验室体验中的以下示例使用自定义数据集对 Llama 2 7B 文本-文本模型进行了微调,以更好地执行问答任务。

  1. 如要开始使用,请单击“Llama 2 微调实验室(https://www.nvidia.com/en-us/launchpad/ai/customize-llama-2-with-enterprise-data/)并申请访问。在 Launchpad 上工作时,Llama 2 模型文件会以 .nemo 检查点的形式预先下载,从而实现与 NVIDIA NeMo Framework 的微调兼容性。

  2. 模型准备就绪后,我们从 Hugging Face 加载 Dolly 数据集(https://huggingface.co/datasets/databricks/databricks-dolly-15k)并对其进行预处理,删除不必要的字段、重命名某些字段,以更好地适应提示调整任务,并将数据集分割成训练文件和测试文件。

    dataset=load_dataset("aisquared/databricks-dolly-15k")

    面所示的是一个数据样本。为了适应特定的用例,数据集可以互换。

    {
    "question": "When did Virgin Australia start operating?", 
    "context": "Virgin Australia, the trading name of Virgin Australia Airlines Pty Ltd, is an Australian-based airline. It is the largest airline by fleet size to use the Virgin brand. It commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.[3] It suddenly found itself as a major airline in Australia's domestic market after the collapse of Ansett Australia in September 2001. The airline has since grown to directly serve 32 cities in Australia, from hubs in Brisbane, Melbourne and Sydney.[4]", 
    "answer": "Virgin Australia commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.", 
    "taskname": "genqa"
    }

  3. 然后,通过更新默认 NeMo 配置文件的某些字段来设置微调作业,以适应当前的训练任务。接着,使用 NeMo 训练脚本启动作业,运行微调并在过程中生成模型检查点。

  4. 微调任务完成后,我们就可以运行笔记本内推理,生成一些示例输出,并评估微调后模型的性能。

  5. 接着让我们来看看这样一个示例输出。我们在上下文中提供了两种产品的描述:割草机和厨房机器人,并询问模型割草机是否由太阳能供电

    该模型准确地把握了上下文,并给出了“是”的回答。在对该模型进行微调后,它就能够根据所提供的上下文准确回答我们的问题了。

    {
    "input": "Context: The Auto Chef Master is a personal kitchen robot that effortlessly turns raw ingredients into gourmet meals with the precision of a Michelin-star chef. The Eco Lawn Mower is a solar powered high-tech lawn mower that provides an eco-friendly and efficient way to maintain your lawn. Question: Is the lawn mower product solar powered? 
    Answer:", 
    "pred": "Yes", 
    "label": "Yes, the Eco Lawn Mower is solar powered.", 
    "taskname": "genqa"
    }

部署模型

NVIDIA AI FoundationEndpoints提供完全无服务器和可扩展的 API,这些 API 可部署在您自己的云或NVIDIA DGX Cloud上。填写此表(https://developer.nvidia.com/login)即可开始使用 AI Foundation Endpoints。

您还可以使用NVIDIA AI Enterprise在自己的云或数据中心基础设施上进行部署。这一端到端的云原生软件平台凭借其企业级的安全性、稳定性、可管理性和支持,能够加速生产级生成式 AI 的开发和部署。当您准备从实验转向生产阶段时,就可以使用 NVIDIA AI Enterprise 的企业级运行时来微调和部署这些模型。

更多信息

通过这篇文章,我们了解了 NVIDIA AI Foundation 模型是如何通过提供易于使用的模型体验界面,以及简化的模型微调和部署路径,从而帮助企业开发者找到适合各种用例的模型。

欢迎探索NVIDIA NGC 目录中提供的不同AI Foundation 模型(https://catalog.ngc.nvidia.com/ai-foundation-models),找到适合您的模型。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,立即注册 GTC 大会


原文标题:利用 NVIDIA AI Foundation Models 构建自定义企业级生成式 AI

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3770

    浏览量

    90986

原文标题:利用 NVIDIA AI Foundation Models 构建自定义企业级生成式 AI

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 开发了一个全新的生成 AI 模型。利用输入的文本和音频,该模型可以创作出包含任意的音乐、人声和声音组合的作品。
    的头像 发表于 11-27 11:29 329次阅读

    NVIDIA助力Amdocs打造生成AI智能体

    正在使用NVIDIA DGX Cloud 与 NVIDIA AI Enterprise软件开发和交付基于商用大语言模型(LLM)和领域适配模型的解决方案。该公司还在使用NVIDIA
    的头像 发表于 11-19 14:48 327次阅读

    在设备上利用AI Edge Torch生成API部署自定义大语言模型

    我们很高兴地发布 AI Edge Torch 生成 API,它能将开发者用 PyTorch 编写的高性能大语言模型 (LLM) 部署至 TensorFlow Lite (TFLite) 运行时
    的头像 发表于 11-14 10:23 420次阅读
    在设备上<b class='flag-5'>利用</b><b class='flag-5'>AI</b> Edge Torch<b class='flag-5'>生成</b><b class='flag-5'>式</b>API部署<b class='flag-5'>自定义</b>大语言模型

    NVIDIA NIM Agent Blueprint加速企业级AI应用落地

    生成 AI 时代,每个企业都在尝试构建自己的 AI 应用,来赋能
    的头像 发表于 11-13 11:35 301次阅读

    生成AI在制造业的应用现状和前景展望

    在上一期《IBM 企业级 AI 为跨国制造业智能化注入新动力》的文章中,我们重点分享了 IBM 企业级AI驱动智能制造升级的若干场景,视觉检测技术及知识库平台的应用案例;接下来,我们将
    的头像 发表于 11-06 17:06 629次阅读

    NVIDIA与思科合作打造企业级生成AI基础设施

    NVIDIA 加速计算平台、NVIDIA AI Enterprise 软件和 NVIDIA NIM 推理微服务加持的思科 Nexus HyperFabric
    的头像 发表于 10-10 09:35 340次阅读

    NVIDIA AI助力SAP生成AI助手Joule加速发展

    在美国佛罗里达州奥兰多举行的 SAP Sapphire 大会上,NVIDIA 与这家企业软件公司公布了搭载NVIDIA AI Enterprise软件的
    的头像 发表于 09-09 09:37 426次阅读

    NVIDIA NeMo加速并简化自定义模型开发

    如果企业希望充分发挥出 AI 的力量,就需要根据其行业需求量身定制的自定义模型。
    的头像 发表于 07-26 11:17 743次阅读
    <b class='flag-5'>NVIDIA</b> NeMo加速并简化<b class='flag-5'>自定义</b>模型开发

    NVIDIA携手Meta推出AI服务,为企业提供生成AI服务

    NVIDIA近日宣布了一项重大举措,正式推出NVIDIA AI Foundry服务与NVIDIA NIM(NVIDIA Inference
    的头像 发表于 07-25 16:57 532次阅读

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成 AI 模型

    Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成 AI 模型服务,以便部署自定义 Llama 3.1
    发表于 07-24 09:39 706次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 为全球<b class='flag-5'>企业</b>打造<b class='flag-5'>自定义</b> Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 模型

    揭秘NVIDIA AI Workbench 如何助力应用开发

    简化和优化生成 AI 开发的工具备受追捧,需求与日俱增。借助基于检索增强生成(RAG)(该技术通过从指定外部来源获取事实资料,来提高生成
    发表于 07-10 18:51 639次阅读
    揭秘<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Workbench 如何助力应用开发

    NVIDIA推出NVIDIA AI Computing by HPE加速生成 AI 变革

    关系进一步深化。助力生成 AI企业级应用与发展加速驶入快车道。 HPE Private Cloud AI 是该解决方案的关键,开创性地
    的头像 发表于 06-20 17:36 711次阅读

    Snowflake推出企业级AI模型

    Snowflake公司近日重磅推出了一款名为Snowflake Arctic的企业级大型语言模型(LLM)。这款AI模型针对复杂的企业工作负载进行了深度优化,特别是在SQL代码生成和指
    的头像 发表于 05-06 14:38 412次阅读

    SAP与NVIDIA携手加速生成AI企业应用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企业客户在 SAP 云解决方案和应用组合中利用数据和生成
    的头像 发表于 03-22 10:02 598次阅读

    NVIDIA推出生成AI微服务,供开发者在CUDA GPU系统中创建部署生成AI助手

    NVIDIA 于今日推出数十项企业级生成 AI 微服务,企业可以
    的头像 发表于 03-20 09:56 455次阅读