NVIDIA NIM助力企业高效部署生成式AI模型-电子发烧友网

Canonical、Nutanix 和 Red Hat 等厂商的开源 Kubernetes 平台集成了 NVIDIA NIM，将允许用户通过 API 调用来大规模地部署大语言模型。

在企业中部署生成式 AI 将变得空前简单。

NVIDIA NIM是一套生成式 AI 推理微服务，将支持 KServe 开源软件，可以自动将 AI 模型以云计算应用的规模运行。

NVIDIA NIM 与 KServe 的组合确保了生成式 AI 可以像任何其他大型企业级应用一样进行部署，还让用户能够通过 Canonical、Nutanix 和 Red Hat 等数十家公司的平台广泛使用 NIM。

NIM 在 KServe 上的集成将使 NVIDIA 的技术扩展到开源社区、生态系统合作伙伴和客户。借助 NIM，他们可以通过 API 调用（即现代编程的一键式操作）来获得NVIDIA AI Enterprise软件平台的性能、支持和安全性。

在 Kubernetes 上提供 AI

KServe 最初是基于 Kubernetes 的机器学习工具包 Kubeflow 的一部分。Kubernete 是一个开源系统，用于部署和管理包含大型分布式应用组件的软件容器。

随着 Kubeflow 在 AI 推理方面的不断扩展，KServe 诞生了，并最终演变成为独立的开源项目。

许多公司都为 KServe 软件做出了贡献并采用了该软件。目前，运行 KServe 软件的公司包括亚马逊云科技、彭博、Canonical、思科、慧与、IBM、Red Hat、Zillow 和 NVIDIA 等。

深入解析 KServe

KServe 本质上是 Kubernetes 的扩展，它像一个强大的云应用一样运行 AI 推理。它使用标准协议，以经过优化的性能运行，并支持 PyTorch、Scikit-learn、TensorFlow 和 XGBoost，而用户无需了解这些 AI 框架的细节。

在新的大语言模型（LLM）层出不穷的情况下，该软件尤其有用。

KServe 让用户可以轻松地在模型之间来回切换，测试哪一个最符合他们的需求。当模型的新版本发布时，KServe 的 “金丝雀发布（canary rollouts）” 功能会自动执行详细验证，并逐步将其部署到生产系统中。

其另一项功能 “GPU 自动缩放” 可以随着服务需求的起伏来高效地管理模型的部署方式，从而使客户和服务提供商获得最佳体验。

生成式 AI 的 API 调用

KServe 的优势现在将通过 NVIDIA NIM 的便捷性提供。

使用 NIM ，只需一个简单的 API 调用即可应对所有的复杂性。企业 IT 管理员能够获得确保应用以最佳性能和效率运行所需的指标，无论应用是在他们的数据中心还是在远程云服务上，即使是在更改了 AI 模型的情况下。

NIM 让 IT 专家成为生成式 AI 专家，变革了公司的运营。这就是为什么 Foxconn 和 ServiceNow 等众多企业都正在部署 NIM 微服务的原因。

NIM 支持数十个 Kubernetes 平台

由于 NIM 与 KServe 的集成，用户将能够在数十个企业平台上访问 NIM，比如 Canonical 的 Charmed KubeFlow 和 Charmed Kubernetes、Nutanix GPT-in-a-Box 2.0、Red Hat 的 OpenShift AI 等等。

KServe 贡献者、Red Hat 首席软件工程师 Yuan Tang 表示：“Red Hat 一直在与 NVIDIA 合作，以便让企业更轻松地使用开源技术来部署 AI。通过增强 KServe 并在 Red Hat OpenShift AI 中增加对 NIM 的支持，我们能够让 Red Hat 的客户更方便地访问 NVIDIA 的生成式 AI 平台。”

“通过将 NVIDIA NIM 推理微服务与 Nutanix GPT-in-a-Box 2.0 集成，客户将能够从云端到边缘以一致的方式去构建可扩展、安全、高性能的生成式 AI 应用。” Nutanix 工程副总裁 Debojyoti Dutta 表示，其团队为 KServe 和 Kubeflow 做出了贡献。

Canonical 的 MLOps 产品经理 Andreea Munteanu 表示：“作为一家对 KServe 做出重大贡献的公司，我们很高兴通过 Charmed Kubernetes 和 Charmed Kubeflow 提供 NIM。在我们的共同努力下，用户将能够轻松地使用生成式 AI 的全部功能，并使其保持最高的性能和效率。”

数十家其他软件提供商都能感受到 NIM 的好处，因为他们的产品中也包含了 KServe。

服务开源社区

NVIDIA 一直积极地参与 KServe 项目。正如最近的一篇技术博客中所提到的，KServe 的开放推理协议已经被用于NVIDIA Triton 推理服务器，可以帮助用户跨多个 GPU、框架和操作模式同时运行许多 AI 模型。

基于 KServe，NVIDIA 专注于在多个 GPU 上一次运行一个 AI 模型的用例。

作为 NIM 集成的一部分，NVIDIA 计划在其开源软件（包括 Triton 和TensorRT-LLM）的基础上，成为 KServe 的积极贡献者。NVIDIA 还是云原生计算基金会（CNCF）的活跃成员，该基金会支持生成式 AI 和其他项目的开源代码。

立即通过 NVIDIA API 目录试用 Llama 3 8B 或 Llama 3 70B 大语言模型的 NIM API。全球数百家 NVIDIA 合作伙伴也正在使用 NIM 来部署生成式 AI。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5104

浏览量
104375
数据中心

数据中心

+关注

关注
16

文章
4951

浏览量
72641
AI

AI

+关注

关注
87

文章
32370

浏览量
271481

原文标题：COMPUTEX 2024 | KServe 提供商在云和数据中心提供由 NIM 赋能的推理

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

聚云科技荣获亚马逊云科技生成式AI能力认证助力企业加速生成式AI应用落地

、数据处理、模型调优到应用集成与部署等方面，助力企业加速生成式

发表于 02-14 13:41 •83次阅读

NVIDIA 发布保障代理式 AI 应用安全的 NIM 微服务

务是 NVIDIA NeMo Guardrails 软件工具系列的一部分。这些可移植且经过优化的推理微服务可帮助企业提高生成式 AI 应用的

发表于 01-17 16:29 •99次阅读

全新NVIDIA NIM微服务实现突破性进展

全新 NVIDIA NIM 微服务实现突破性进展，可助力气象技术公司开发和部署 AI 模型，实现

发表于 11-21 10:07 •361次阅读

NVIDIA助力企业创建定制AI应用

NVIDIA 近日宣布与众多技术领导者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA

发表于 11-20 09:12 •476次阅读

NVIDIA助力Amdocs打造生成式AI智能体

正在使用NVIDIA DGX Cloud 与 NVIDIA AI Enterprise软件开发和交付基于商用大语言模型（LLM）和领域适配模型

发表于 11-19 14:48 •481次阅读

NVIDIA 携手全球合作伙伴推出 NIM Agent Blueprints，助力企业打造属于自己的 AI

可定制工作流目录加快核心生成式 AI 用例的部署速度。首批用例包括客户服务、药物研发和 PDF 数据提取，未来将加入更多用例企业可以使用

发表于 08-28 10:10 •275次阅读

借助NVIDIA NIM加速AI应用部署

大语言模型（LLM）在企业组织中的应用日益广泛，许多企业都将其整合到 AI 应用中。虽然从基础模型着手十分

发表于 08-23 16:38 •513次阅读

全新NVIDIA NIM微服务将生成式AI引入数字环境

生成式物理 AI NIM 微服务以及 NVIDIA Metropolis 参考工作流旨在协助创建智能的沉浸

发表于 08-02 15:20 •664次阅读

NVIDIA NIM:打造AI领域的AI-in-a-Box,提高AI开发与部署的高效性

据7月30日官方发布的资讯显示，在全球备受瞩目的计算机图形学盛会——SIGGRAPH 2024上，NVIDIA公司对外展示了其在诸如渲染、仿真及生成式AI等前沿领域所取得的卓越成果，而

发表于 07-30 16:27 •833次阅读

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

NVIDIA近日宣布了一项重大举措，正式推出NVIDIA AI Foundry服务与NVIDIA NIM（

发表于 07-25 16:57 •637次阅读

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务，与同样刚推出的 Llama 3.1

发表于 07-25 09:48 •831次阅读

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成式 AI 模型服务，以便

发表于 07-24 09:39 •774次阅读

生成式AI医疗崭露头角:Meta Llama 3 NIM引数十公司关注

为NVIDIA NIM推理微服务在ai.nvidia.com网站上供大家下载。这使得医疗健康开发者、科研人员及企业能在各类应用中合理创新，而NIM

发表于 06-07 15:25 •1653次阅读

英伟达推出AI模型推理服务NVIDIA NIM

英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型

发表于 06-04 09:15 •790次阅读

NVIDIA NIM 革命性地改变模型部署，将全球数百万开发者转变为生成式 AI 开发者

部署在云、数据中心或工作站上。借助 NVIDIA NIM，开发者能够轻松地为 copilots、聊天机器人等构建生成式

发表于 06-03 09:12 •288次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

NVIDIA NIM助力企业高效部署生成式AI模型

评论

聚云科技荣获亚马逊云科技生成式AI能力认证助力企业加速生成式AI应用落地

NVIDIA 发布保障代理式 AI 应用安全的 NIM 微服务

全新NVIDIA NIM微服务实现突破性进展

NVIDIA助力企业创建定制AI应用

NVIDIA助力Amdocs打造生成式AI智能体

NVIDIA 携手全球合作伙伴推出 NIM Agent Blueprints，助力企业打造属于自己的 AI

借助NVIDIA NIM加速AI应用部署

全新NVIDIA NIM微服务将生成式AI引入数字环境

NVIDIA NIM:打造AI领域的AI-in-a-Box,提高AI开发与部署的高效性

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

生成式AI医疗崭露头角:Meta Llama 3 NIM引数十公司关注

英伟达推出AI模型推理服务NVIDIA NIM

NVIDIA NIM 革命性地改变模型部署，将全球数百万开发者转变为生成式 AI 开发者