在 NGC 上玩转新一代推理部署工具 FastDeploy，几行代码搞定 AI 部署-电子发烧友网

号外：

全场景高性能 AI 部署工具

FastDeploy 发版 v1.0

几行代码搞定 AI 部署，快速使用 150+ 预置部署示例，支持 CV、NLP、Speech、Cross-model 模型，并提供开箱即用的云边端部署体验，实现 AI 模型端到端的推理性能优化。

欢迎广大开发者使用 NVIDIA 与飞桨联合深度适配的 NGC 飞桨容器，在 NVIDIA GPU 上进行体验 FastDeploy！

全场景高性能 AI 部署工具 FastDeploy

人工智能技术在各行各业正加速应用落地。为了向开发者提供产业实践推理部署最优解，百度飞桨发起了 FastDeploy 开源项目。FastDeploy 具备全场景、简单易用、极致高效三大特点。

（1）简单易用：几行代码完成 AI 模型的 GPU 部署，一行命令切换推理后端，快速体验 150+ 热门模型部署

FastDeploy 精心设计模型 API，不同语言统一 API 体验，只需要几行核心代码，就可以实现预知模型的高性能推理，极大降低了 AI 模型部署难度和工作量。一行命令切换 TensorRT、Paddle Inference、ONNX Runtime、Poros 等不同推理后端，充分利用推理引擎在 GPU 硬件上的优势。

import fastdeploy as fd
import cv2
option = fd.RuntimeOption()
option.use_gpu()
option.use_trt_backend() # 一行命令切换使用 TensorRT部署
model = fd.vision.detection.PPYOLOE("model.pdmodel", 
                                    "model.pdiparams", 
                                    "infer_cfg.yml",
                                    runtime_option=option)
im = cv2.imread("test.jpg")
result=model.predict(im)

FastDeploy 几行命令完成 AI 模型部署

FastDeploy 支持 CV、NLP、Speech、Cross-modal（跨模态）四大 AI 领域，覆盖 20 多主流场景、150 多个 SOTA 产业模型的端到端示例，包括图像分类、图像分割、语义分割、物体检测、字符识别（OCR）、人脸检测、人脸关键点检测、人脸识别、人像扣图、视频扣图、姿态估计、文本分类、信息抽取、文图生成、行人跟踪、语音合成等。支持飞桨 PaddleClas、PaddleDetection、PaddleSeg、PaddleOCR、PaddleNLP、PaddleSpeech 6 大热门 AI 套件的主流模型及生态（如 PyTorch、ONNX 等）热门模型的部署。

FastDeploy 在 NVIDIA GPU、Jetson上的 AI 模型部署库

（2）全场景：支持多框架，轻松搞定 PaddlePaddle、PyTorch、ONNX 等模型部署

FastDeploy 支持 TensorRT、Paddle Inference、ONNX Runtime、Poros 推理引擎，统一部署 API，只需要一行代码，便可灵活切换多个 GPU 推理引擎后端。内置了 X2Paddle 和 Paddle2ONNX 模型转换工具，只需要一行命令便可完成其他深度学习框架到飞桨以及 ONNX 的相互转换，让其他框架的开发者也能通过 FastDeploy 体验到飞桨模型压缩与推理引擎的端到端优化效果。覆盖 GPU、Jetson Nano、Jetson TX2、Jetson AGX、Jetson Orin 等云边端场景全系列 NVIDIA 硬件部署。同时支持服务化部署、离线部署、端侧部署方式。

（3）极致高效：一键压缩提速，预处理加速，端到端性能优化，提升 AI 算法产业落地

FastDeploy 集成了自动压缩工具，在参数量大大减小的同时（精度几乎无损），推理速度大幅提升。使用 CUDA 加速优化预处理和后处理模块，将 YOLO 系列的模型推理加速整体从 41ms 优化到 25ms。端到端的优化策略，彻底解决 AI 部署落地中的性能难题。更多性能优化，欢迎关注 GitHub 了解详情。

https://github.com/PaddlePaddle/FastDeploy

FastDeploy 一行命令实现自动压缩，充分利用硬件资源提升推理速度

FastDeploy 提升 AI 任务端到端推理速

直播预告：服务化部署高并发调优实战

12 月 12 日 - 12 月 30 日，《产业级 AI 模型部署全攻略》系列直播课程，FastDeploy 联合 10 家硬件公司与大家直播见面。

12 月 14 日 20:30 开始，NVIDIA 与百度资深专家将为大家带来以“一键搞定服务化部署，实现稳定高并发服务”为主题的精彩分享，详细解说 FastDeploy 服务化部署实战教学，以及如何提升 GPU 利用率和吞吐量！欢迎大家扫码报名获取直播链接，加入交流群与行业精英深度共同探讨 AI 部署落地话题。

一键搞定服务化部署

实现稳定高并发服务

12 月 14 日，星期三，20:30

精彩亮点

企业级 NGC 容器，快速获取强大的软硬件能力
三行代码搞定 AI 部署，一键体验 150+ 部署 demo
服务化部署实战教学，提升 GPU 利用率和吞吐量

会议嘉宾

Adam | NVIDIA 亚太区资深产品经理

Jason｜百度资深研发工程师

参与方式

扫码报名获取直播链接

原文标题：在 NGC 上玩转新一代推理部署工具 FastDeploy，几行代码搞定 AI 部署

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3778

浏览量
91140

原文标题：在 NGC 上玩转新一代推理部署工具 FastDeploy，几行代码搞定 AI 部署

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

企业AI模型部署攻略

当下，越来越多的企业开始探索和实施AI模型，以提升业务效率和竞争力。然而，AI模型的部署并非易事，需要企业在多个层面进行细致的规划和准备。下面，AI

发表于 12-23 10:31 •113次阅读

AI模型部署边缘设备的奇妙之旅：目标检测模型

应用而设计，模块的参数如下图所示。这个模块有着一个很吸引人的特点与飞桨低代码开发工具 PaddleX 完美适配，配合飞桨星河社区 Al Studio, 可以实现一键训练；配合凌智视觉

发表于 12-19 14:33

如何开启Stable Diffusion WebUI模型推理部署

如何开启Stable Diffusion WebUI模型推理部署

发表于 12-11 20:13 •108次阅读

AI模型部署边缘设备的奇妙之旅：如何实现手写数字识别

种更适合生产环境的框架来部署。此外，许多推理引擎和硬件加速器也支持ONNX格式，从而进一步加快了模型部署的速度。在凌智视觉模块中模型转换就

发表于 12-06 17:20

用Ollama轻松搞定Llama 3.2 Vision模型本地部署

Ollama 是一个开源的大语言模型服务工具，它的核心目的是简化大语言模型（LLMs）的本地部署和运行过程，请参考《Gemma 2+Ollama在算力魔方

发表于 11-23 17:22 •1098次阅读

如何在STM32f4系列开发板上部署STM32Cube.AI，

已下载STM32Cube.AI扩展包，但是无法使用，感觉像是没有部署AI模型，我是想要通过摄像头拍照，上传图像后，经过开发板处理器进行AI模型处理识别过后，告诉我识别结果，显示

发表于 11-18 09:39

在设备上利用AI Edge Torch生成式API部署自定义大语言模型

，从而无缝地将新的设备端生成式 AI 模型部署到边缘设备上。本文是 Google AI Edge 博客连载的第二篇。上

发表于 11-14 10:23 •442次阅读

YOLOv6在LabVIEW中的推理部署（含源码）

相关介绍文章，所以笔者在实现YOLOv6 ONNX 在LabVIEW中的部署推理后，决定和各位读者分享一下如何使用LabVIEW实现YOLO

发表于 11-06 16:07 •277次阅读

使用OpenVINO Model Server在哪吒开发板上部署模型

OpenVINO Model Server(OVMS)是一个高性能的模型部署系统，使用C++实现，并在Intel架构上的部署进行了优化，使用OpenVINO 进行

发表于 11-01 14:19 •288次阅读

混合部署 | 在RK3568上同时部署RT-Thread和Linux系统-迅为电子

混合部署 | 在RK3568上同时部署RT-Thread和Linux系统-迅为电子

发表于 09-06 15:32 •428次阅读

三行代码完成生成式AI部署

LLM加载与推理部署能力，实现了OpenVINO对CNN网络、生成式模型、LLM网络主流模型的全面推理支持。

发表于 08-30 16:49 •425次阅读

简单两步使用OpenVINO™搞定Qwen2的量化与部署任务

英特尔 OpenVINO™ 工具套件是一款开源 AI 推理优化部署的工具套件，可帮助开发人员和企

发表于 04-26 09:39 •1692次阅读

简单三步使用OpenVINO™搞定ChatGLM3的本地部署

英特尔 OpenVINO™ 工具套件是一款开源 AI 推理优化部署的工具套件，可帮助开发人员和企

发表于 04-03 18:18 •2084次阅读

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

看到CUBE_AI已经支持到STM32F0系列芯片，就想拿来入门嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直无法创建成功。

发表于 03-15 08:10

基于OpenCV DNN实现YOLOv8的模型部署与推理演示

基于OpenCV DNN实现YOLOv8推理的好处就是一套代码就可以部署在Windows10系统、乌班图系统、Jetson的Jetpack系

发表于 03-01 15:52 •1646次阅读