NVIDIA助力提供多样、灵活的模型选择-电子发烧友网

案例简介

在本案例中，Dify 以模型中立以及开源生态的优势，为广大 AI 创新者提供丰富的模型选择。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服务器产品，为 Dify.AI 提供了灵活多样的模型集成选择，专业、高效的模型接入方式让开发者用户能够构建丰富的 AI 应用场景。

AI 应用面临落地挑战

随着 AI 应用场景的不断丰富，Dify 在 AI 应用的落地方面面临了几个关键挑战，这些挑战成为了采用 NVIDIA 产品和技术的主要驱动力：

复杂应用场景需要多个模型结合使用：随着越来越丰富的 AI 应用情景探索，越来越多的企业都期望能灵活使用当前最先进的闭源或开源模型，来定制落地方案，以获得模型在不同情境下的能力表现、成本、性能等方面的最佳组合结果。

大模型的性能和稳定性风险：⼤模型的训练和推理对算力、算法、数据都有很高要求，如果选型不当或优化不足，可能影响应⽤的性能和稳定性。

数据安全和隐私保护风险：企业在落地 AI 应用时，出于对敏感场景应用和企业数据安全的考虑，会更倾向本地部署推理框架来运行他们的本地模型。

NVIDIA 助力提供多样、灵活的模型选择

Dify 平台与数百种专有/开源模型以及数十种推理提供商、自托管解决方案无缝集成，包括 LLM 推理框架、Rerank 模型、Embedding 模型等类型，允许用户根据其具体场景需要，随时切换/使用不同的模型能力。其中，Dify 集成了 API Catalog、NVIDIA NIM 和 Triton 推理服务器开源软件产品作为可选模型平台之一，具体作用如下所述：

提供丰富的预训练模型，满足多样化需求

API Catalog 提供了大量针对NVIDIA GPU优化的预训练模型，涵盖了 LLM、Embedding、Rerank 和 Vision 多个种类。它主要用于评估和测试，提供一个统一的接口，可以测试各种模型，节省开发成本。API Catalog 会持续更新最新的模型，帮助 Dify 用户加速前期的测试和评估，并为之后的量产部署做好铺垫，加速 AI 应用的开发和落地。

简化部署流程，加速生成式 AI 模型上线

NVIDIA NIM 将 AI 模型打包为容器化微服务，开发者只需几行代码即可完成部署，部署时间可从数周缩短到数分钟。这种简化的部署流程可以显著加速生成式 AI 模型的上线，使企业能够快速将模型集成到 Dify 的 AI 工作流中，实现 AI 应用落地。

优化推理性能，提供高效稳定的 AI 服务

Triton 推理服务器提供了一个优化和标准化的平台，用于部署和执行来自多种深度学习和机器学习框架的 AI 模型。它适用于通用的 AI 推理工作负载，为开发者在 Dify 平台上编排 AI 应用提供高效稳定的模型服务。

灵活调用模型，适应不同场景需求

通过 Triton 推理服务器和 NVIDIA NIM 完成模型部署后，用户可以在 Dify 平台中轻松调用所需的模型。只需在模型设置中填写 Server URL、Model Name 等凭据，即可根据具体的场景需求，随时切换或使用不同的模型能力。这种灵活的模型调用方式可以帮助企业快速适应不断变化的业务需求，提高 AI 应用的适应性和可扩展性。

加入 NVIDIA Inception，

融入全球开发者社区生态

Dify 不仅与 NVIDIA 在模型层面实现了深度集成，其还于 2024 年 4 月入选了NVIDIA Inception 初创加速计划。Dify 也受邀参加了 NVIDIA 初创加速计划最新开启的系列技术加速营，获得了与众多 AI 创新者、行业客户、生态上下游企业交流合作和极大的市场曝光机会。

加入 NVIDIA 初创加速计划对 Dify 来说，标志着一个新的里程碑，Dify 将借助 NVIDIA 的影响力链接全球开发者，在其领先技术的助力下，不断突破，打造更繁荣的生态和产品。

Dify 创始人兼 CEO 张路宇表示：“Dify 成立的第一天，就定位是一个面向全球开发者用户的产品，我们希望接入全球领先的大模型，共创 AI 解决方案，为不同行业落地 AI 的企业、AI 创新者们提供开箱即用的 LLM 应用开发平台，这也是我们首选 NVIDIA 的原因。在全球的客户生态、开发者生态经营上，NVIDIA 毋庸置疑是我们最好的选择。”

繁荣的开源社区生态，

加速 AI 创新应用落地

Dify 团队成立于 2023 年 3 月，同年 5 月发布 Dify.AI 第一个版本并开源。基于 LLMOps 及后端即服务的理念，为企业提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力，致力于打造⼀个开放的 LLM 应⽤开发平台，降低 LLM 应⽤程序的开发和部署复杂性，帮助应⽤开发者更快地搭建和运营⽣产级的⽣成式 AI 应⽤。

Dify 在开源社区受到全球开发者的关注和喜爱，在短短一年的时间内，stars 数已超过 36,000+，达到数十万次下载量，多次登榜 GitHub 全球趋势榜单。GitHub stars 已超越知名 AI Infra 产品如 LlamaIndex、flowise 等，仅次于 LangChain。面向需要探索 AI 应用创新、AI 应用落地业务的开发者或企业客户，Dify 提供成熟的应用开发工具平台，加速 AI 落地业务的过程。

截至 2024 年 4 月，Dify.AI 已经服务了十余家 500 强企业和数十家上市公司。全球领先企业选择 Dify 作为 LLM App Stack，标杆客户覆盖汽车、先进制造、消费、半导体、医药等行业，如理想汽车、研华股份、百胜中国、Panasonic、Advantech、安克创新、得到等。Dify.AI 同时也吸引了全球范围内关注 LLM 应用技术的创业者和服务商，他们可以基于 NVIDIA 的资源和生态，利用 Dify 作为开发工具，创造出更多创新性 AI 产品和服务，带来更多生态合作的空间。

NVIDIA 初创加速计划

Dify.AI是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。 NVIDIA 初创加速计划为免费会员制，旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构、创业孵化器、创业加速器、行业合作伙伴以及科技创业媒体等，打造创业加速生态系统。能够提供产品折扣、技术支持、市场宣传、融资对接、业务推荐等一系列服务，加速创业公司的发展。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5093

浏览量
104008
AI

AI

+关注

关注
87

文章
32007

浏览量
270832
大模型

大模型

+关注

关注
2

文章
2709

浏览量
3311

原文标题：初创加速计划 | NVIDIA 赋能 Dify.AI，加速企业 AI 应用落地

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

NVIDIA推出开放式Llama Nemotron系列模型

作为 NVIDIA NIM 微服务，开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何加速系统上为 AI 智能体提供强效

发表于 01-09 11:11 •291次阅读

NVIDIA推出面向RTX AI PC的AI基础模型

NVIDIA 今日发布能在 NVIDIA RTX AI PC 本地运行的基础模型，为数字人、内容创作、生产力和开发提供强大助力。

发表于 01-08 11:01 •283次阅读

NVIDIA Cosmos世界基础模型平台发布

NVIDIA 宣布推出NVIDIA Cosmos，该平台由先进的生成式世界基础模型、高级 tokenizer、护栏和加速视频处理管线组成，将推动自动驾驶汽车（AV）和机器人等物理 AI 系统的发展。

发表于 01-08 10:39 •220次阅读

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 开发了一个全新的生成式 AI 模型。利用输入的文本和音频，该模型可以创作出包含任意的音乐、人声和声音组合的作品。

发表于 11-27 11:29 •485次阅读

NVIDIA Isaac Sim满足模型的多样化训练需求

光轮智能借助 NVIDIA Isaac Sim，通过 3D 生成与建模技术构建高度逼真的虚拟场景，将现实世界的复杂场景抽象并转化为高质量的训练数据源，从而更有效地满足模型的多样化训练需求。 AI

发表于 11-23 14:55 •681次阅读

NVIDIA AI助力初创企业为心理治疗师提供AI工具

NVIDIA AI 助力初创企业为心理治疗师提供 AI 工具，以此来优化和提升心理健康服务水平，为人们的心理健康保驾护航。

发表于 11-19 16:03 •301次阅读

NVIDIA助力Amdocs打造生成式AI智能体

正在使用NVIDIA DGX Cloud 与 NVIDIA AI Enterprise软件开发和交付基于商用大语言模型（LLM）和领域适配模型的解决方案。该公司还在使用

发表于 11-19 14:48 •453次阅读

NVIDIA NIM助力企业高效部署生成式AI模型

Canonical、Nutanix 和 Red Hat 等厂商的开源 Kubernetes 平台集成了 NVIDIA NIM，将允许用户通过 API 调用来大规模地部署大语言模型。

发表于 10-10 09:49 •482次阅读

NVIDIA Modulus助力风阻预测模型实现

NVIDIA 与百度飞桨双方技术团队通过在数据、算法、模型等多个方面的合作，共同打造了一款适用于车辆空气动力学数值模拟的 3D 高精度汽车风阻预测模型——DNNFluid-Car。经过训练

发表于 08-23 17:10 •1007次阅读

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成式 AI 模型服务，以便部署自定义 Llama 3.1 NVIDIA NIM 微服务和新的 NVIDIA

发表于 07-24 09:39 •761次阅读

NVIDIA Omniverse 将为全新 OpenPBR 材质模型提供原生支持

、组合、模拟和协作的可扩展框架和生态系统，OpenUSD 使开发者能够构建可互操作的 3D 工作流，开启了工业数字化的新时代。此外，NVIDIA Omniverse 还将为全新 OpenPBR 材质模型

发表于 06-14 11:23 •729次阅读

NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

Enterprise-IGX软件现已在NVIDIA IGX平台上正式可用，以满足工业边缘对实时 AI 计算日益增长的需求。它们将共同帮助医疗、工业和科学计算领域的解决方案提供商利用企业级软件和支持来加快开发

发表于 06-04 10:21 •584次阅读

NVIDIA与Google DeepMind合作推动大语言模型创新

支持 NVIDIA NIM 推理微服务的谷歌最新开源模型 PaliGemma 首次亮相。

发表于 05-16 09:44 •533次阅读

【大语言模型：原理与工程实践】大语言模型的应用

输出的关键词或短语。对于任何输入，大语言模型都会根据提示词提供相应的输出。例如，“天空是”就是一个提示词，引导模型输出关于天空的描述。提示词的完善度和信息量直接影响模型输出的质量和是否

发表于 05-07 17:21

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库，用于优化从 PC 到云端的 NVID

发表于 04-28 10:36 •673次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

NVIDIA助力提供多样、灵活的模型选择

评论

NVIDIA推出开放式Llama Nemotron系列模型

NVIDIA推出面向RTX AI PC的AI基础模型

NVIDIA Cosmos世界基础模型平台发布

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA Isaac Sim满足模型的多样化训练需求

NVIDIA AI助力初创企业为心理治疗师提供AI工具

NVIDIA助力Amdocs打造生成式AI智能体

NVIDIA NIM助力企业高效部署生成式AI模型

NVIDIA Modulus助力风阻预测模型实现

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

NVIDIA Omniverse 将为全新 OpenPBR 材质模型提供原生支持

NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

NVIDIA与Google DeepMind合作推动大语言模型创新

【大语言模型：原理与工程实践】大语言模型的应用

NVIDIA加速微软最新的Phi-3 Mini开源语言模型