NVIDIA Triton 系列文章（7）：image_client 用户端参数-电子发烧友网

作为服务器的最重要任务，就是要接受来自不同终端所提出的各种请求，然后根据要求执行对应的计算，再将计算结果返回给终端。

当 Triton 推理服务器运行起来之后，就进入等待请求的状态，因此我们所要提出的请求内容，就必须在用户端软件里透过参数去调整请求的内容，这部分在 Triton 相关使用文件中并没有提供充分的说明，因此本文的重点就在于用Python 版的 image_client.py 来说明相关参数的内容，其他用户端的参数基本上与这个端类似，可以类比使用。

本文的实验内容，是将 Triton 服务器安装在 IP 为 192.168.0.10 的 Jetson AGX Orin 上，将 Triton 用户端装在 IP 为 192.168.0.20 的树莓派上，读者可以根据已有的设备资源自行调配。

在开始进行实验之前，请先确认以下两个部分的环境：

在服务器设备上启动 Triton 服务器，并处于等待请求的状态：

如果还没启动的话，请直接执行以下指令：

# 根据实际的模型仓根目录位置设定TRITON_MODEL_REPO路径
$  export TRITON_MODEL_REPO=${HOME}/triton/server/docs/examples/model_repository
执行Triton服务器
$  dockerrun--rm--net=host-v${TRITON_MODEL_REPO}:/modelsnvcr.io/nvidia/tritonserver:22.09-py3tritonserver--model-repository=/models

在用户端设备下载 Python 的用户端范例，并提供若干张要检测的图片：

先执行以下指令，确认Triton服务器已经正常启动，并且从用户端设备可以访问：

$  curl -v 192.168.0.10:8000/v2/health/ready

只要后面出现的信息中有“HTTP/1.1 200 OK”部分，就表示一切正常。

如果还没安装 Triton 的 Python 用户端环境，并且还未下载用户端范例的话，请执行以下指令：

$  cd ${HOME}/triton
$  git clone https://github.com/triton-inference-server/client
$  cd client/src/python/examples
# 安装 Triton 的 Python用户端环境
$  pip3installtritonclient[all]attrdict-ihttps://pypi.tuna.tsinghua.edu.cn/simple

最后记得在用户端设备上提供几张图片，并且放置在指定文件夹（例如~/images）内，准备好整个实验环境，就可以开始下面的说明。

现在执行以下指令，看一下 image_client 这个终端的参数列表：

$  python3 image_client.py

会出现以下的信息：

接下来就来说明这些参数的用途与用法。

用“-u”参数对远程服务器提出请求：

如果用户端与服务器端并不在同一台机器上的时候，就可以用这个参数对远程 Triton 服务器提出推理请求，请执行以下指令：

$  python3 image_client.py  -m  inception_graphdef  -u 192.168.0.10:8000  -s INCEPTION ${HOME}/images/mug.jpg

由于 Triton 的跨节点请求主要透过 HTTP/REST 协议处理，需要透过 8000 端口进行传输，因此在“-u”后面需要接上“IP:8000”就能正常使用。

请自行检查回馈的计算结果是否正确！

2. 用“-m”参数去指推理模型：

从“python3 image_client.py”所产生信息的最后部分，可以看出用“-m”参数去指定推理模型是必须的选项，但是可以指定哪些推理模型呢？就得从 Triton 服务器的启动信息中去寻找答案。

下图是本范例是目前启动的 Triton 推理服务器所支持的模型列表：

这里显示有的 8 个推理模型，就是启动服务器时使用“--model-repository=”参数指定的模型仓内容，因此客户端使用“-m”参数指定的模型，必须是在这个表所列的内容之列，例如“-mdensenet_onnx”、“-m inception_graphdef”等等。

现在执行以下两道指令，分别看看使用不同模型所得到的结果有什么差异：

$  python3 image_client.py  -m densenet_onnx  -u 192.168.0.10:8000  -s INCEPTION ${HOME}/images/mug.jpg
$  python3image_client.py-minception_graphdef-u192.168.0.10:8000-sINCEPTION${HOME}/images/mug.jpg

使用 densenet_onnx 模型与 inception_graphdef 模型所返回的结果，分别如下：

虽然两个模型所得到的检测结果一致，但是二者所得到的置信度表达方式并不相同，而且标签编号并不一样（504 与 505）。

这个参数后面还可以使用“-x”去指定“版本号”，不过目前所使用的所有模型都只有一个版本，因此不需要使用这个参数。

3. 使用“-s”参数指定图像缩放方式：

有些神经网络算法在执行推理之前，需要对图像进行特定形式的缩放（scaling）处理，因此需要先用这个参数指定缩放的方式，如果没有指定正确的模式，会导致推理结果的错误。目前这个参数支持{NONE, INSPECTION, VGG}三个选项，预设值为“NONE”。

在本实验 Triton 推理服务器所支持的 densenet_onnx 与 inception_graphdef 模型，都需要选择 INSPECTION 缩放方式，因此执行指令中需要用“-s INSPECTION”去指定，否则会得到错误的结果。

请尝试以下指令，省略前面指定中的“-s INSPECTION”，或者指定为 VGG 模式，看看结果如何？

$  python3 image_client.py  -m inception_graphdef -u 192.168.0.10:8000  -s VGG ${HOME}/images/mug.jpg

4. 对文件夹所有图片进行推理

如果有多个要进行推理计算的标的物（图片），Triton 用户端可用文件夹为单位来提交要推理的内容，例如以下指令就能一次对 ${HOME}/images 目录下所有图片进行推理：

$  python3 image_client.py  -m  inception_graphdef  -u 192.168.0.10:8000  -s INCEPTION ${HOME}/images

例如我们在文件夹中准备了 car.jpg、mug.jpg、vulture.jpg 三种图片，如下：

执行后反馈的结果如下：

显示推理检测的结果是正确的！

5. 用“-b”参数指定批量处理的值

执行前面指令的结果可以看到“batch size 1”，表示用户端每次提交一张图片进行推理，所以出现 Request1、Request 2 与 Request 3 总共提交三次请求。

现在既然有 3 张图片，可否一次提交 3 张图片进行推理呢？我们可以用“-b”参数来设定，如果将前面的指令中添加“-b3”这个参数，如下：

$  python3 image_client.py  -m  inception_graphdef  -u 192.168.0.10:8000  -s INCEPTION ${HOME}/images  -b 3

现在显示的结果如下：

现在看到只提交一次“batch size 3”的请求，就能对三张图片进行推理。如果 batch 值比图片数量大呢？例如改成“-b 5”的时候，看看结果如何？如下：

现在可以看到所推理的图片数量是 5，其中 1/4、2/5 是同一张图片，表示重复使用了。这样就应该能清楚这个“batchsize”值的使用方式。

但如果这里将模型改成 densenet_onnx 的时候，执行以下指令：

$  python3 image_client.py  -m  densenet_onnx  -u 192.168.0.10:8000  -s INCEPTION ${HOME}/images  -b 3

会得到“ERROR: This model doesn't support batching.”的错误信息，这时候就回头检查以下模型仓里 densenet_onnx 目录下的 config.pbtxt 配置文件，会发现里面设置了“max_batch_size: 0”，并不支持批量处理。

而 inception_graphdef 模型的配置文件里设置“max_batch_size: 128”，如果指令给定“-b”参数大于这个数值，也会出现错误信息。

6. 其他：

另外还有指定通讯协议的“-i”参数、使用异步推理 API 的“-a”参数、使用流式推理 API 的“--streaming”参数等等，属于较进阶的用法，在这里先不用过度深入。

以上所提供的 5 个主要参数，对初学者来说是非常足够的，好好掌握这几个参数就已经能开始进行更多图像方面的推理实验。

推荐阅读

NVIDIA Jetson Nano 2GB 系列文章（1）：开箱介绍

NVIDIA Jetson Nano 2GB 系列文章（2）：安装系统

NVIDIA Jetson Nano 2GB 系列文章（3）：网络设置及添加 SWAPFile 虚拟内存

NVIDIA Jetson Nano 2GB 系列文章（4）：体验并行计算性能

NVIDIA Jetson Nano 2GB 系列文章（5）：体验视觉功能库

NVIDIA Jetson Nano 2GB 系列文章（6）：安装与调用摄像头

NVIDIA Jetson Nano 2GB 系列文章（7）：通过 OpenCV 调用 CSI/USB 摄像头

NVIDIA Jetson Nano 2GB 系列文章（8）：执行常见机器视觉应用

NVIDIA Jetson Nano 2GB 系列文章（9）：调节 CSI 图像质量

NVIDIA Jetson Nano 2GB 系列文章（10）：颜色空间动态调节技巧

NVIDIA Jetson Nano 2GB 系列文章（11）：你应该了解的 OpenCV

NVIDIA Jetson Nano 2GB 系列文章（12）：人脸定位

NVIDIA Jetson Nano 2GB 系列文章（13）：身份识别

NVIDIA Jetson Nano 2GB 系列文章（14）：Hello AI World

NVIDIA Jetson Nano 2GB 系列文章（15）：Hello AI World 环境安装

NVIDIA Jetson Nano 2GB 系列文章（16）：10行代码威力

NVIDIA Jetson Nano 2GB 系列文章（17）：更换模型得到不同效果

NVIDIA Jetson Nano 2GB 系列文章（18）：Utils 的 videoSource 工具

NVIDIA Jetson Nano 2GB 系列文章（19）：Utils 的 videoOutput 工具

NVIDIA Jetson Nano 2GB 系列文章（20）：“Hello AI World” 扩充参数解析功能

NVIDIA Jetson Nano 2GB 系列文章（21）：身份识别

NVIDIA Jetson Nano 2GB 系列文章（22）：“Hello AI World” 图像分类代码

NVIDIA Jetson Nano 2GB 系列文章（23）：“Hello AI World 的物件识别应用

NVIDIAJetson Nano 2GB 系列文章（24）: “Hello AI World” 的物件识别应用

NVIDIAJetson Nano 2GB 系列文章（25）: “Hello AI World” 图像分类的模型训练

NVIDIAJetson Nano 2GB 系列文章（26）: “Hello AI World” 物件检测的模型训练

NVIDIAJetson Nano 2GB 系列文章（27）: DeepStream 简介与启用

NVIDIAJetson Nano 2GB 系列文章（28）: DeepStream 初体验

NVIDIAJetson Nano 2GB 系列文章（29）: DeepStream 目标追踪功能

NVIDIAJetson Nano 2GB 系列文章（30）: DeepStream 摄像头“实时性能”

NVIDIAJetson Nano 2GB 系列文章（31）: DeepStream 多模型组合检测-1

NVIDIAJetson Nano 2GB 系列文章（32）: 架构说明与deepstream-test范例

NVIDIAJetsonNano 2GB 系列文章（33）: DeepStream 车牌识别与私密信息遮盖

NVIDIA Jetson Nano 2GB 系列文章（34）: DeepStream 安装Python开发环境

NVIDIAJetson Nano 2GB 系列文章（35）: Python版test1实战说明

NVIDIAJetson Nano 2GB 系列文章（36）: 加入USB输入与RTSP输出

NVIDIAJetson Nano 2GB 系列文章（37）: 多网路模型合成功能

NVIDIAJetson Nano 2GB 系列文章（38）: nvdsanalytics视频分析插件

NVIDIAJetson Nano 2GB 系列文章（39）: 结合IoT信息传输

NVIDIAJetson Nano 2GB 系列文章（40）: Jetbot系统介绍

NVIDIAJetson Nano 2GB 系列文章（41）: 软件环境安装

NVIDIAJetson Nano 2GB 系列文章（42）: 无线WIFI的安装与调试

NVIDIAJetson Nano 2GB 系列文章（43）: CSI摄像头安装与测试

NVIDIAJetson Nano 2GB 系列文章（44）: Jetson的40针引脚

NVIDIAJetson Nano 2GB 系列文章（45）: I2C总线与PiOLED

NVIDIAJetson Nano 2GB 系列文章（46）: 机电控制设备的安装

NVIDIAJetson Nano 2GB 系列文章（47）: 组装过程的注意细节

NVIDIAJetson Nano 2GB 系列文章（48）: 用键盘与摇杆控制行动

NVIDIAJetson Nano 2GB 系列文章（49）: 智能避撞之现场演示

NVIDIAJetson Nano 2GB 系列文章（50）: 智能避障之模型训练

NVIDIAJetson Nano 2GB 系列文章（51）: 图像分类法实现找路功能

NVIDIAJetson Nano 2GB 系列文章（52）: 图像分类法实现找路功能

NVIDIAJetson Nano 2GB 系列文章（53）: 简化模型训练流程的TAO工具套件

NVIDIA Jetson Nano 2GB 系列文章（54）：NGC的内容简介与注册密钥

NVIDIA Jetson Nano 2GB 系列文章（55）：安装TAO模型训练工具

NVIDIA Jetson Nano 2GB 系列文章（56）：启动器CLI指令集与配置文件

NVIDIA Jetson Nano 2GB 系列文章（57）：视觉类脚本的环境配置与映射

NVIDIA Jetson Nano 2GB 系列文章（58）：视觉类的数据格式

NVIDIA Jetson Nano 2GB 系列文章（59）：视觉类的数据增强

NVIDIA Jetson Nano 2GB 系列文章（60）：图像分类的模型训练与修剪

NVIDIA Jetson Nano 2GB 系列文章（61）：物件检测的模型训练与优化

NVIDIA Jetson Nano 2GB 系列文章（62）：物件检测的模型训练与优化-2

NVIDIA Jetson Nano 2GB 系列文章（63）：物件检测的模型训练与优化-3

NVIDIA Jetson Nano 2GB 系列文章（64）：将模型部署到Jetson设备

NVIDIA Jetson Nano 2GB 系列文章（65）：执行部署的 TensorRT 加速引擎

NVIDIA Jetson 系列文章（1）：硬件开箱

NVIDIA Jetson 系列文章（2）：配置操作系统

NVIDIA Jetson 系列文章（3）：安装开发环境

NVIDIA Jetson 系列文章（4）：安装DeepStream

NVIDIA Jetson 系列文章（5）：使用Docker容器的入门技巧

NVIDIA Jetson 系列文章（6）：使用容器版DeepStream

NVIDIA Jetson 系列文章（7）：配置DS容器Python开发环境

NVIDIA Jetson 系列文章（8）：用DS容器执行Python范例

NVIDIA Jetson 系列文章（9）：为容器接入USB摄像头

NVIDIA Jetson 系列文章（10）：从头创建Jetson的容器（1）

NVIDIA Jetson 系列文章（11）：从头创建Jetson的容器（2）

NVIDIA Jetson 系列文章（12）：创建各种YOLO-l4t容器

NVIDIA Triton系列文章（1）：应用概论

NVIDIA Triton系列文章（2）：功能与架构简介

NVIDIA Triton系列文章（3）：开发资源说明

NVIDIA Triton系列文章（4）：创建模型仓

NVIDIA Triton 系列文章（5）：安装服务器软件

NVIDIA Triton 系列文章（6）：安装用户端软件

原文标题：NVIDIA Triton 系列文章（7）：image_client 用户端参数

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3771

浏览量
90995

原文标题：NVIDIA Triton 系列文章（7）：image_client 用户端参数

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

智能电表用户端口的折返限流应用说明

电子发烧友网站提供《智能电表用户端口的折返限流应用说明.pdf》资料免费下载

发表于 09-13 09:43 •0次下载

NVIDIA JetPack 6.0版本的关键功能

NVIDIA JetPack SDK 支持 NVIDIA Jetson 模块，为构建端到端加速 AI 应用提供全面的解决方案。JetPack 6 通过微服务和一

发表于 09-09 10:18 •409次阅读

<b class='flag-5'>NVIDIA</b> JetPack 6.0版本的关键功能

NVIDIA助力提供多样、灵活的模型选择

在本案例中，Dify 以模型中立以及开源生态的优势，为广大 AI 创新者提供丰富的模型选择。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服务器产品，为

发表于 09-09 09:19 •461次阅读

分布式能源是什么意思？分布式能源有什么优势？

分布式能源指的是在用户端或靠近用户端的小型能源供应系统，它能够直接满足用户的多种能源需求，如电力、热能和冷能。

发表于 04-29 17:26 •2250次阅读

变电所、配电室、机房、箱变等用户端供配电配电室综合监测系统

、水泵）、门禁监控子系统（读卡器、开门按钮、磁力锁）、安防监控子系统（双鉴检测器）。应用场所：适用于35kV及以下新建或改扩建的变电所、配电室、机房、箱变等用户端供配电自动化系统工程设计、施工和运行维护。实时监测能够

发表于 03-28 13:15 •667次阅读

变电所、配电室、机房、箱变等<b class='flag-5'>用户端</b>供配电配电室综合监测系统

牵手NVIDIA 元戎启行端到端模型将搭载 DRIVE Thor芯片

NVIDIA的DRIVE Thor芯片适配公司的端到端智能驾驶模型。据悉，元戎启行是业内首批能用 DRIVE Thor芯片适配端到端模型的企

发表于 03-25 11:49 •334次阅读

牵手<b class='flag-5'>NVIDIA</b> 元戎启行<b class='flag-5'>端</b>到<b class='flag-5'>端</b>模型将搭载 DRIVE Thor芯片

适用于35kV及以下新建或改扩建的用户端供配电自动化系统电力监控系统

的组网方式。应用场所：适用于35kV及以下新建或改扩建的用户端供配电自动化系统工程设计、施工和运行维护。云平台结构云平台功能实时监测直观显示配电网的运行状态，实时监测各回路电参数信息，动态监视各配电回路有关故障、告警等信号。

发表于 03-15 14:28 •301次阅读

适用于35kV及以下新建或改扩建的<b class='flag-5'>用户端</b>供配电自动化系统电力监控系统

适用于35kV及以下新建或改扩建的用户端Acrel-2000Z电力监控

发表于 03-08 16:56 •300次阅读

适用于35kV及以下新建或改扩建的<b class='flag-5'>用户端</b>Acrel-2000Z电力监控

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

发表于 02-29 14:04 •576次阅读

在AMD GPU上如何安装和配置triton？

最近在整理python-based的benchmark代码，反过来在NV的GPU上又把Triton装了一遍，发现Triton的github repo已经给出了对应的llvm的commit id以及对应的编译细节，然后跟着走了一遍，也顺利的安装成功，只需要按照如下方式即可完

发表于 02-22 17:04 •2358次阅读

在AMD GPU上如何安装和配置<b class='flag-5'>triton</b>？

一文浅谈电能管理系统

功能： 用户端消耗着整个电网80%的电能，用户端智能化用电管理对用户可靠、安全、节约用电有十分重要的意义。构建智能用电服务体系，全面推广用户端智能仪表、智能用电管理终端等设备用电管

发表于 01-31 15:45 •358次阅读

ACRELADL系列多功能电能表在迪拜大厦EMS中的应用

in Dubai Building’s EMS 摘要：用户端消耗着整个电网80%的电能，用户端智能化用电管理对用户可靠、安全、节约用电有十分重要的意义。构建智能用电服务体系，推广用户端

发表于 01-30 14:27 •353次阅读

【BBuf的CUDA笔记】OpenAI Triton入门笔记一

这里来看官方的介绍：https://openai.com/research/triton ，从官方的介绍中我们可以看到OpenAI Triton的产生动机以及它的目标是什么，还可以看到一些经典算法的实现例子展示。

发表于 01-23 10:00 •2564次阅读

利用NVIDIA产品技术组合提升用户体验

本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型，并借助NVIDIA Triton推理服务器在NVIDIA V100 GPU上进行高效部署，帮助必优科技的文

发表于 01-17 09:30 •687次阅读

CMOS Image sensor的基础知识

摄像机用来成像的感光元件叫做Image Sensor或Imager。目前广泛使用的2种Image Sensor是CCD和CMOS Image Sensor（CIS）。

发表于 01-15 11:07 •5089次阅读

搜索历史

NVIDIA Triton 系列文章（7）：image_client 用户端参数

评论