0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA NIM微服务带来巨大优势

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-08-23 15:20 次阅读

新服务通过热门 AI 模型为数百万开发者带来高达 5 倍的 token 效率提升,使他们能够立即访问在 NVIDIA DGX Cloud 上运行的 NIM 微服务。

全球最大人工智能社区之一 Hugging Face 平台上的 400 万开发者在一些最热门的 AI 模型上可轻松获得 NVIDIA 加速推理。

借助新的推理即服务能力,开发者将能够快速部署 Llama 3 系列和 Mistral AI 模型等领先的大语言模型,并使用运行在NVIDIA DGX Cloud上的NVIDIA NIM微服务进行优化。

这项服务在 SIGGRAPH 大会上发布,它将帮助开发者利用托管在 Hugging Face Hub 上的开源 AI 模型快速建立原型并将其部署在生产中。Enterprise Hub 用户可以利用 NVIDIA NIM 进行无服务器推理,以提高灵活性,尽可能降低基础设施用度并优化性能。

推理服务补充了在 DGX Cloud 端的训练(Train on DGX Cloud),一种已在 Hugging Face 上提供的 AI 训练服务。

由于开发者面对着越来越多的开源模型,可供其轻松比较各种选项的资源中心会非常有帮助。这些训练和推理工具为 Hugging Face 开发者提供了在 NVIDIA 加速基础设施上试验、测试和部署先进模型的新方法。它们可以通过 Hugging Face 模型卡上的“训练”和“部署”下拉菜单轻松访问,用户只需点击几下就能轻松使用这些功能。

不仅限于 Token 层面的提升

— NVIDIA NIM 带来巨大优势

NVIDIA NIM 是一系列 AI 微服务(包括 NVIDIA AI 基础模型和开源社区模型)的集合,而且已使用行业标准应用编程接口(API)针对推理进行了优化。

NIM 为用户带来更高的 token 处理效率 — token 是语言模型使用和生成的数据单位。经优化的微服务还能改善底层 NVIDIA DGX Cloud 基础架构的效率,从而提高关键 AI 应用的速度。

这意味着,与模型的其他版本相比,开发者可以通过访问 NIM AI 模型,更快、更可靠地得到结果。例如,与 NVIDIA Tensor Core GPU 驱动系统上的现成部署相比,通过 NIM 访问 Llama 3 的 700 亿参数版本时,可实现最高达 5 倍的吞吐量提升。

近乎即时的 DGX Cloud

访问让 AI 加速触手可及

NVIDIA DGX Cloud 平台专为生成式 AI 打造,为开发者提供轻松访问可靠加速计算基础设施的途径,帮助他们更快地将生产就绪型应用推向市场。

该平台提供可扩展的 GPU 资源,可为从原型设计到生产的每一步 AI 开发提供支持,同时无需开发者做出长期的 AI 基础设施承诺。

借助由 NIM 微服务提供支持、在 NVIDIA DGX Cloud 上运行的 Hugging Face 推理即服务,用户可轻松访问针对 AI 部署进行优化的计算资源,在企业级环境中实验最新的 AI 模型。

详细了解在 SIGGRAPH 大会上

发布的 NVIDIA NIM 相关信息

在 SIGGRAPH 大会上,NVIDIA 还推出了面向 OpenUSD 框架的生成式 AI 模型和 NIM 微服务,以加速开发者构建高精度虚拟世界的能力,推动 AI 再次演进。

体验超过 100 种 NVIDIA NIM 微服务在各行各业的应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4792

    浏览量

    102414
  • AI
    AI
    +关注

    关注

    87

    文章

    28791

    浏览量

    266101
  • 人工智能
    +关注

    关注

    1787

    文章

    46011

    浏览量

    234717
  • 微服务
    +关注

    关注

    0

    文章

    126

    浏览量

    7301

原文标题:SIGGRAPH 2024 | Hugging Face 为开发者带来由 NVIDIA NIM 提供支持的推理即服务

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    借助NVIDIA Metropolis微服务构建视觉AI应用

    伴随着视觉 AI 复杂性的增加,精简的部署解决方案已成为优化空间和流程的关键。NVIDIA 能够加快企业的开发速度,借助 NVIDIA Metropolis AI 工作流和微服务,企业只需数周就能将想法变成现实,而原本这项工作需
    的头像 发表于 09-09 09:46 115次阅读
    借助<b class='flag-5'>NVIDIA</b> Metropolis<b class='flag-5'>微服务</b>构建视觉AI应用

    NVIDIA 携手全球合作伙伴推出 NIM Agent Blueprints,助力企业打造属于自己的 AI

    NVIDIA AI Enterprise 平台中的 NIM 微服务与 NeMo 框架构建和运行他们的 AI 应用,创建数据驱动型 AI 飞轮 埃森哲、思科、戴尔科技、德勤、慧与、联想、SoftServe
    发表于 08-28 10:10 141次阅读
    <b class='flag-5'>NVIDIA</b> 携手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,助力企业打造属于自己的 AI

    借助NVIDIA NIM微服务助力可口可乐公司扩展生成式AI内容

    借助 NVIDIA NIM 微服务 USD Search 和 USD Code,市场营销领导者 WPP 帮助饮料公司在全球范围内加速创意活动的迭代。
    的头像 发表于 08-13 16:16 423次阅读

    全新NVIDIA NIM微服务将生成式AI引入数字环境

    生成式物理 AI NIM 微服务以及 NVIDIA Metropolis 参考工作流旨在协助创建智能的沉浸式工作环境。
    的头像 发表于 08-02 15:20 385次阅读

    采用OpenUSD和NVIDIA NIM微服务创建精准品牌视觉

    全球领先的创意和制作服务机构率先采用 OpenUSD 和 NVIDIA NIM 微服务来创建精准的品牌视觉。
    的头像 发表于 08-01 14:33 319次阅读

    NVIDIA提供一套服务、模型以及计算平台 加速人形机器人发展

    开发者可以访问新的 NVIDIA NIM 微服务,用于 Isaac Lab 和 Isaac Sim 中的机器人仿真、OSMO 机器人云计算编排服务和远程操作数据捕获工作流等。 为加速全
    的头像 发表于 07-31 10:41 486次阅读

    全新 NVIDIA NeMo Retriever微服务大幅提升LLM的准确性和吞吐量

    企业能够通过提供检索增强生成功能的生产就绪型 NVIDIA NIM 推理微服务,充分挖掘业务数据的价值。这些微服务现已集成到 Cohesity、DataStax、NetApp 和 Sn
    的头像 发表于 07-26 11:13 648次阅读
    全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever<b class='flag-5'>微服务</b>大幅提升LLM的准确性和吞吐量

    NVIDIA携手Meta推出AI服务,为企业提供生成式AI服务

    NVIDIA近日宣布了一项重大举措,正式推出NVIDIA AI Foundry服务NVIDIA NIM
    的头像 发表于 07-25 16:57 385次阅读

    英伟达推出全新NVIDIA AI Foundry服务NVIDIA NIM推理微服务

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务NVIDIA NIM 推理微服务
    的头像 发表于 07-25 09:48 559次阅读

    NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服务

    采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成式 AI 微服务,以加速新一代数字人的发展,并将在平台上推出全新的生成式 AI 突破。客户服务、游戏和医疗健康领域的公司率先
    的头像 发表于 06-04 10:18 509次阅读

    英伟达推出AI模型推理服务NVIDIA NIM

    英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程,为全球的2800万英伟达开发者提供前所未有的便利。
    的头像 发表于 06-04 09:15 526次阅读

    NVIDIA将全球数百万开发者转变为生成式 AI 开发者

    来自 AI 生态系统各个领域的 150 余家合作伙伴嵌入了 NIM 推理微服务,将企业级 AI 应用的部署时间从数周缩短至几分钟 NVIDIA 开发者计划会员可免费使用 NIM 来进行
    的头像 发表于 06-03 18:21 896次阅读

    NVIDIA NIM 革命性地改变模型部署,将全球数百万开发者转变为生成式 AI 开发者

    来自 AI 生态系统各个领域的 150 余家合作伙伴嵌入了 NIM 推理微服务,将企业级 AI 应用的部署时间从数周缩短至几分钟 NVIDIA 开发者计划会员可免费使用 NIM 来进行
    发表于 06-03 09:12 179次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b> 革命性地改变模型部署,将全球数百万开发者转变为生成式 AI 开发者

    NVIDIA与Google DeepMind合作推动大语言模型创新

    支持 NVIDIA NIM 推理微服务的谷歌最新开源模型 PaliGemma 首次亮相。
    的头像 发表于 05-16 09:44 363次阅读

    NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

    微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。 NVIDIA NeMo Retriever 是 NVIDIA NeMo (一个用于构建、自定义和部署生成式
    的头像 发表于 11-29 21:05 527次阅读