蔚来基于NVIDIA Triton搭建的推理服务平台-电子发烧友网

在近日举行的 GTC 大会上，蔚来 AI 平台负责人白宇利带来非常有价值的分享，他首次对外透露了蔚来自研的全栈式自动驾驶系统（NAD）的部署和开发情况，同时也将蔚来自动驾驶研发平台（NADP）这个神秘的“Peta Factory”带到了公众视野中。

据了解，NADP是服务于蔚来自动驾驶核心业务方向的研发平台，用于开发 NAD 功能。以“Peta”为名是因为每辆车每天能生成 55 petabit数据（1 petabit = 10^6 gigabit = 10^9 megabit = 10^15 bits），而 NADP 是所有流程、工作流、数据以及底层软硬件的组合。NADP 能够以一站式平台管理大量复杂的 AI 应用，并将模型开发效率提高 20 倍，从而缩短自动驾驶汽车的上市周期，开发出更新、更快的架构。

在模型训练、测试和部署的过程中，为了确保新改进能够切实地解决相应问题，且不会引发任何新问题， NADP 需要执行 10 万项推理任务，包括数据挖掘、仿真和回归测试。经过众多方案的对比和筛选，蔚来选用了NVIDIA Triton 推理服务器作为核心组件，构建了 NADP 的高性能推理服务。

正如白宇利在分享中提到：“我们基于 NVIDIA Triton 推理服务器构建了高性能推理服务。此服务非常适用于 NADP，并可轻松集成模型仓库、工作流、Jupyter、Prometheus 和许多其他组件，从而简化 AI 推理。Triton 让编排和扩展变得更轻松，还能将推理速度提高至 6 倍，并可节省 24% 的资源。”

蔚来基于 NVIDIA Triton 搭建的推理服务平台，在数据挖掘业务场景下，通过服务器端模型前处理和多模型 DAG 式编排，GPU 资源平均节省 24%；在部分核心 pipeline 上，吞吐能力提升为原来的 5 倍，整体时延降低为原来的 1/ 6。

Triton 在设计之初，就融入了云原生的设计思路，为后面逐步围绕 Triton 搭建完整的云原生平台性推理解决方案提供了相当大的便利。

作为 NADP 推理平台的核心组件，Triton 与 NADP 的各个组件形成了一套完整的推理一站式解决方案。从集成效率、高性能、易用性、高可用四方面，在 NADP 推理平台中提供助力。

目前，NADP 数据挖掘业务下的相关模型预测服务已经全部迁移至 Triton 推理服务器，为上百个模型提供了高吞吐预测能力。同时在某些任务基础上，通过自实现前处理算子、前后处理服务化、BLS 串联模型等手段，将一些模型任务合并起来，极大的提升了处理效率。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4994

浏览量
103159
自动驾驶

自动驾驶

+关注

关注
784

文章
13838

浏览量
166529
蔚来

蔚来

+关注

关注
1

文章
481

浏览量
14563

原文标题：成功案例：蔚来 NADP + NVIDIA Triton，搭建稳定高效的推理平台

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

Triton编译器在机器学习中的应用

1. Triton编译器概述 Triton编译器是NVIDIA Triton推理服务

发表于 12-24 18:13 •380次阅读

企业云服务器平台设计与搭建

企业云服务器平台的设计与搭建是一个复杂但系统的过程，涉及多个环节和因素。主机推荐小编为您整理发布企业云服务器平台设计与

发表于 12-04 09:51 •104次阅读

蔚来能源与阿维塔达成充电服务合作协议

近日，武汉蔚来能源有限公司（“蔚来能源”）与阿维塔科技（重庆）有限公司（“阿维塔”）正式达成充电服务合作协议。

发表于 11-19 10:20 •216次阅读

广东电网与蔚来合作，肇庆首座蔚来换电站正式上线

近日，广东电网电动汽车服务有限公司与蔚来汽车的合作取得重要进展，由前者投资建设的首座蔚来换电站已在广东省肇庆市正式上线运营。这一里程碑式的合

发表于 11-11 13:41 •713次阅读

NVIDIA与思科合作打造企业级生成式AI基础设施

由 NVIDIA 加速计算平台、NVIDIA AI Enterprise 软件和 NVIDIA NIM 推理微

发表于 10-10 09:35 •360次阅读

NVIDIA助力提供多样、灵活的模型选择

在本案例中，Dify 以模型中立以及开源生态的优势，为广大 AI 创新者提供丰富的模型选择。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服务器

发表于 09-09 09:19 •482次阅读

全新 NVIDIA NeMo Retriever微服务大幅提升LLM的准确性和吞吐量

企业能够通过提供检索增强生成功能的生产就绪型 NVIDIA NIM 推理微服务，充分挖掘业务数据的价值。这些微服务现已集成到 Cohesity、DataStax、NetApp 和 Sn

发表于 07-26 11:13 •854次阅读

全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever微<b class='flag-5'>服务</b>大幅提升LLM的准确性和吞吐量

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

NVIDIA近日宣布了一项重大举措，正式推出NVIDIA AI Foundry服务与NVIDIA NIM（NVIDIA Inference

发表于 07-25 16:57 •551次阅读

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务

发表于 07-25 09:48 •717次阅读

英伟达推出AI模型推理服务NVIDIA NIM

英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程，为全球的2800万英伟达开发者提供前所未有的便利。

发表于 06-04 09:15 •685次阅读

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将

发表于 04-20 09:39 •742次阅读

蔚来与宁德时代就长寿命电池业务正式签约

3月14日，蔚来与宁德时代就长寿命电池业务正式签约。基于此，蔚来汽车的BaaS电池租用服务也进行了调整。

发表于 03-15 10:41 •417次阅读

蔚来汽车2023年财报出炉蔚来亏损211亿

蔚来汽车2023年财报出炉蔚来亏损211亿根据蔚来发布的2023年四季度及全年财报数据显示

发表于 03-06 12:11 •2286次阅读

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI

发表于 02-29 14:04 •589次阅读

利用NVIDIA产品技术组合提升用户体验

本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型，并借助NVIDIA Triton推理服务器在

发表于 01-17 09:30 •703次阅读

搜索历史

蔚来基于NVIDIA Triton搭建的推理服务平台

评论

Triton编译器在机器学习中的应用

企业云服务器平台设计与搭建

蔚来能源与阿维塔达成充电服务合作协议

广东电网与蔚来合作，肇庆首座蔚来换电站正式上线

NVIDIA与思科合作打造企业级生成式AI基础设施

NVIDIA助力提供多样、灵活的模型选择

全新 NVIDIA NeMo Retriever微服务大幅提升LLM的准确性和吞吐量

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

英伟达推出AI模型推理服务NVIDIA NIM

利用NVIDIA组件提升GPU推理的吞吐

蔚来与宁德时代就长寿命电池业务正式签约

蔚来汽车2023年财报出炉蔚来亏损211亿

使用NVIDIA Triton推理服务器来加速AI预测

利用NVIDIA产品技术组合提升用户体验