NVIDIA Triton 系列文章（5）：安装服务器软件-电子发烧友网

在前一篇文章已经带着读者创建一个 Triton 的推理模型仓，现在只要安装好服务器端与用户端软件，就能进行基本的测试与体验。

为了简化过程，我们使用 NVIDIA Jetson AGX Orin 设备进行示范，所有步骤都能适用于各种基于 NVIDIA Jetson 智能芯片的边缘设备上，也适用于大部分装载 Ubuntu 18 以上操作系统的 x86 设备上，即便设备上没有安装 NVIDIA 的 GPU 计算卡也能使用，只不过我们的提供的内容都是基于 GPU 计算环境，对于纯 CPU 的使用则需要用户自行研读说明文件。

现在就开始安装 Triton 服务器软件，NVIDIA 为 Triton 服务器提供以下三种软件安装的方式：

1. 源代码编译

这种方式需要从https://github.com/triton-inference-server/server下载源代码，然后安装依赖库，再用 cmake 与 make 工具进行编译。通常会遇到的麻烦是步骤繁琐，并且出错率较高，因此并不推荐使用这个方法。

有兴趣者，请自行参考前面下载的开源仓里的docs/customization_guide/build.md文件，有关于 Ubuntu 20.04、Jetpack 与 Windows 等各种平台的编译细节。

2. 可执行文件

Triton 开发团队为使用者提供编译好的可执行文件，包括 Ubuntu 20.04、Jetpack 与Windows 平台，可以在https://github.com/triton-inference-server/server/releases/ 上获取，每个版本都会提供对应 NGC 容器的版本，如下图：

然后到下面的“Assets”选择合适的版本：

以装载 Jetpack 5 的 Orin 为例，就下载

tritonserver2.26.0-jetpack5.0.2.tgz(1.13GB)压缩文件到本机上，然后解压缩到指定目录下就可以，例如 ${HOME}/triton 目录，会生成、、、、、等 6 个目录，可执行文件在目录下。

在执行 Triton 服务器软件前，还得先安装所需要的依赖库，请执行以下指令：

sudo apt-get update
sudoapt-getinstall-y--no-install-recommendssoftware-properties-commonautoconfautomakebuild-essentialgitlibb64-devlibre2-devlibssl-devlibtoollibboost-devrapidjson-devpatchelfpkg-configlibopenblas-devlibarchive-devzlib1g-dev

‍

现在就可以执行以下指令启动 Triton 服务器：

cd  ${HOME}/triton
bin/tritonserver--model-repository=server/docs/examples/model_repository--backend-directory=backends--backend-config=tensorflow,version=2

如果最后出现以下画面并且进入等待状态：

现在 Triton 服务器已经正常运行，进入等待用户端提出请求（request）的状态。

3. Docker容器

在NGC的

https://catalog.ngc.nvidia.com/orgs/nvidia/containers/tritonserver/tags可以找到 Triton 服务器的 Docker 镜像文件，每个版本主要提供以下几种版本：

year-xy-py3：包含 Triton 推理服务器，支持 Tensorflow、PyTorch、TensorRT、ONNX 和 OpenVINO 模型；
year-xy-py3-sdk：包含 Python 和 C++ 客户端库、客户端示例和模型分析器；
year-xy-tf2-python-py3：仅支持 TensorFlow 2.x 和 python 后端的 Triton 推理服务器；
year-xy-pyt-python-py3：仅支持 PyTorch 和 python 后端的 Triton 服务器；
year-xy-py3-min：用作创建自定义 Triton 服务器容器的基础，如 Customize Triton Container（自定义Triton容器）说明文件所描述的内容；

其中“year”是年份的数字，例如 2022 年提交的就是“22”开头；后面的“xy”是流水号，每次往上加“1”，例如 2022 年 10 月 4 日提交的版本为“22-09”。

NVIDIA 提供的 Triton 容器镜像是同时支持 x86 / AMD64 与 ARM64 架构的系统，以 22.09-py3 镜像为例，可以看到如下图所标示的“2 Architectures”:

点击最右方的“向下”图标，会展开如下图的内容，事实上是有两个不同版本的镜像，不过使用相同镜像名：

因此在 x86 电脑与 Jetson 设备都使用相同的镜像下载指令，如下：

$  docker pull nvcr.io/nvidia/tritonserver:22.09-py3

就能根据所使用设备的 CPU 架构去下载对应的镜像，现在执行以下指令来启动 Triton 服务器：

# 根据实际的模型仓根目录位置设定TRITON_MODEL_REPO路径
export TRITON_MODEL_REPO=${HOME}/triton/server/docs/examples/model_repository
# 执行Triton服务器
dockerrun--rm--net=host-v${TRITON_MODEL_REPO}:/modelsnvcr.io/nvidia/tritonserver:22.09-py3tritonserver--model-repository=/models

如果执行正常，也会出现以下的等待画面，表示运行是正确的：

以上三种方式都能在计算设备上启动 Triton 服务器软件，目前看起来使用 Docker 镜像是最为简单的。当服务器软件启动之后，就处于“等待请求”状态，可以使用“Ctrl-C”组合键终止服务器的运行。

有一种确认 Triton 服务器正常运行的最简单方法，就是用 curl 指令检查 HTTP 端口的状态，请执行以下指令：

curl -v localhost:8000/v2/health/ready

如果有显示“HTTP/1.1 200 OK”的信息（如下图），就能确定 Triton 服务器处于正常运行的状态：

接下去就要安装客户端软件，用来对服务器提出推理请求，这样才算完成一个最基础的推理周期。

推荐阅读

NVIDIA Jetson Nano 2GB 系列文章（1）：开箱介绍

NVIDIA Jetson Nano 2GB 系列文章（2）：安装系统

NVIDIA Jetson Nano 2GB 系列文章（3）：网络设置及添加 SWAPFile 虚拟内存

NVIDIA Jetson Nano 2GB 系列文章（4）：体验并行计算性能

NVIDIA Jetson Nano 2GB 系列文章（5）：体验视觉功能库

NVIDIA Jetson Nano 2GB 系列文章（6）：安装与调用摄像头

NVIDIA Jetson Nano 2GB 系列文章（7）：通过 OpenCV 调用 CSI/USB 摄像头

NVIDIA Jetson Nano 2GB 系列文章（8）：执行常见机器视觉应用

NVIDIA Jetson Nano 2GB 系列文章（9）：调节 CSI 图像质量

NVIDIA Jetson Nano 2GB 系列文章（10）：颜色空间动态调节技巧

NVIDIA Jetson Nano 2GB 系列文章（11）：你应该了解的 OpenCV

NVIDIA Jetson Nano 2GB 系列文章（12）：人脸定位

NVIDIA Jetson Nano 2GB 系列文章（13）：身份识别

NVIDIA Jetson Nano 2GB 系列文章（14）：Hello AI World

NVIDIA Jetson Nano 2GB 系列文章（15）：Hello AI World 环境安装

NVIDIA Jetson Nano 2GB 系列文章（16）：10行代码威力

NVIDIA Jetson Nano 2GB 系列文章（17）：更换模型得到不同效果

NVIDIA Jetson Nano 2GB 系列文章（18）：Utils 的 videoSource 工具

NVIDIA Jetson Nano 2GB 系列文章（19）：Utils 的 videoOutput 工具

NVIDIA Jetson Nano 2GB 系列文章（20）：“Hello AI World” 扩充参数解析功能

NVIDIA Jetson Nano 2GB 系列文章（21）：身份识别

NVIDIA Jetson Nano 2GB 系列文章（22）：“Hello AI World” 图像分类代码

NVIDIA Jetson Nano 2GB 系列文章（23）：“Hello AI World 的物件识别应用

NVIDIAJetson Nano 2GB 系列文章（24）: “Hello AI World” 的物件识别应用

NVIDIAJetson Nano 2GB 系列文章（25）: “Hello AI World” 图像分类的模型训练

NVIDIAJetson Nano 2GB 系列文章（26）: “Hello AI World” 物件检测的模型训练

NVIDIAJetson Nano 2GB 系列文章（27）: DeepStream 简介与启用

NVIDIAJetson Nano 2GB 系列文章（28）: DeepStream 初体验

NVIDIAJetson Nano 2GB 系列文章（29）: DeepStream 目标追踪功能

NVIDIAJetson Nano 2GB 系列文章（30）: DeepStream 摄像头“实时性能”

NVIDIAJetson Nano 2GB 系列文章（31）: DeepStream 多模型组合检测-1

NVIDIAJetson Nano 2GB 系列文章（32）: 架构说明与deepstream-test范例

NVIDIAJetsonNano 2GB 系列文章（33）: DeepStream 车牌识别与私密信息遮盖

NVIDIA Jetson Nano 2GB 系列文章（34）: DeepStream 安装Python开发环境

NVIDIAJetson Nano 2GB 系列文章（35）: Python版test1实战说明

NVIDIAJetson Nano 2GB 系列文章（36）: 加入USB输入与RTSP输出

NVIDIAJetson Nano 2GB 系列文章（37）: 多网路模型合成功能

NVIDIAJetson Nano 2GB 系列文章（38）: nvdsanalytics视频分析插件

NVIDIAJetson Nano 2GB 系列文章（39）: 结合IoT信息传输

NVIDIAJetson Nano 2GB 系列文章（40）: Jetbot系统介绍

NVIDIAJetson Nano 2GB 系列文章（41）: 软件环境安装

NVIDIAJetson Nano 2GB 系列文章（42）: 无线WIFI的安装与调试

NVIDIAJetson Nano 2GB 系列文章（43）: CSI摄像头安装与测试

NVIDIAJetson Nano 2GB 系列文章（44）: Jetson的40针引脚

NVIDIAJetson Nano 2GB 系列文章（45）: I2C总线与PiOLED

NVIDIAJetson Nano 2GB 系列文章（46）: 机电控制设备的安装

NVIDIAJetson Nano 2GB 系列文章（47）: 组装过程的注意细节

NVIDIAJetson Nano 2GB 系列文章（48）: 用键盘与摇杆控制行动

NVIDIAJetson Nano 2GB 系列文章（49）: 智能避撞之现场演示

NVIDIAJetson Nano 2GB 系列文章（50）: 智能避障之模型训练

NVIDIAJetson Nano 2GB 系列文章（51）: 图像分类法实现找路功能

NVIDIAJetson Nano 2GB 系列文章（52）: 图像分类法实现找路功能

NVIDIAJetson Nano 2GB 系列文章（53）: 简化模型训练流程的TAO工具套件

NVIDIA Jetson Nano 2GB 系列文章（54）：NGC的内容简介与注册密钥

NVIDIA Jetson Nano 2GB 系列文章（55）：安装TAO模型训练工具

NVIDIA Jetson Nano 2GB 系列文章（56）：启动器CLI指令集与配置文件

NVIDIA Jetson Nano 2GB 系列文章（57）：视觉类脚本的环境配置与映射

NVIDIA Jetson Nano 2GB 系列文章（58）：视觉类的数据格式

NVIDIA Jetson Nano 2GB 系列文章（59）：视觉类的数据增强

NVIDIA Jetson Nano 2GB 系列文章（60）：图像分类的模型训练与修剪

NVIDIA Jetson Nano 2GB 系列文章（61）：物件检测的模型训练与优化

NVIDIA Jetson Nano 2GB 系列文章（62）：物件检测的模型训练与优化-2

NVIDIA Jetson Nano 2GB 系列文章（63）：物件检测的模型训练与优化-3

NVIDIA Jetson Nano 2GB 系列文章（64）：将模型部署到Jetson设备

NVIDIA Jetson Nano 2GB 系列文章（65）：执行部署的 TensorRT 加速引擎

NVIDIA Jetson 系列文章（1）：硬件开箱

NVIDIA Jetson 系列文章（2）：配置操作系统

NVIDIA Jetson 系列文章（3）：安装开发环境

NVIDIA Jetson 系列文章（4）：安装DeepStream

NVIDIA Jetson 系列文章（5）：使用Docker容器的入门技巧

NVIDIA Jetson 系列文章（6）：使用容器版DeepStream

NVIDIA Jetson 系列文章（7）：配置DS容器Python开发环境

NVIDIA Jetson 系列文章（8）：用DS容器执行Python范例

NVIDIA Jetson 系列文章（9）：为容器接入USB摄像头

NVIDIA Jetson 系列文章（10）：从头创建Jetson的容器（1）

NVIDIA Jetson 系列文章（11）：从头创建Jetson的容器（2）

NVIDIA Jetson 系列文章（12）：创建各种YOLO-l4t容器

NVIDIA Triton系列文章（1）：应用概论

NVIDIA Triton系列文章（2）：功能与架构简介

NVIDIA Triton系列文章（3）：开发资源说明

NVIDIA Triton系列文章（4）：创建模型仓

原文标题：NVIDIA Triton 系列文章（5）：安装服务器软件

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3771

浏览量
90991

原文标题：NVIDIA Triton 系列文章（5）：安装服务器软件

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

如何在Windows上设置SFTP服务器

: 微软提供的开源SSH服务器，支持SFTP。 2. 安装SFTP服务器软件以WinSCP Server为例，以下是安装步骤：步骤2.

发表于 11-13 14:23 •1367次阅读

使用zabbix监控云服务器的方法

Zabbix环境在开始监控云服务器之前，你需要准备Zabbix环境。这包括安装Zabbix服务器、Zabbix代理和配置Web界面。 2.1 安装Zabbix

发表于 11-08 10:47 •232次阅读

服务器数据恢复—搬迁导致服务器无法识别raid的数据恢复案例

NFS+FTP作为单位内部的文件服务器使用。服务器为ProLiant DL380系列服务器，通过hp smart array控制器挂载了一组

发表于 07-25 16:34 •397次阅读

使用windows版mosquitto软件自建一个服务器

本文介绍使用windows版mosquitto软件，自建一个服务器用于测试产品IG532。 1.登录官网，下载windows版mosquitto软件，并安装 https

发表于 07-24 06:39

服务器数据恢复—同品牌新老型号服务器raid5阵列数据恢复方法分析

服务器数据恢复环境：一台某品牌LH6000系列服务器，通过NetRaid阵列卡将4块硬盘组建为一组RAID5磁盘阵列。操作系统都为Window server，数据库是SQLServ

发表于 07-08 13:48 •250次阅读

云存储服务器怎么配置

服务的核心设备，其配置直接影响到云存储的性能、可靠性和安全性。本文将详细介绍云存储服务器的配置过程，包括硬件选择、软件安装、网络配置、数据管理、安全策略等方面。硬件选择云存储

发表于 07-02 09:15 •858次阅读

服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

一台某品牌X3650M3服务器，服务器中有一组raid5磁盘阵列，上层采用zfs文件系统。 服务器未知原因崩溃，工作人员排查故障后发现服务器

发表于 06-04 11:08 •514次阅读

服务器托管和租用区别是什么

商提供，用户只需要根据自己业务需要和硬件配置的要求选择机房服务器即可。 2、价格成本在价格成本方面，服务器租用费用高于托管。 服务器租用需要由IDC服务商提供

发表于 06-03 17:18 •799次阅读

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

发表于 02-29 14:04 •576次阅读

服务器远程不上服务器怎么办？服务器无法远程的原因是什么？

、安全软件问题被安全软件屏蔽了解决办法：检查云锁和安全狗类安全软件有没有把电脑本地IP加入服务器白名单中，如果没有的话就把电脑本地IP加入白名单就可以了

发表于 02-27 16:21

在AMD GPU上如何安装和配置triton？

最近在整理python-based的benchmark代码，反过来在NV的GPU上又把Triton装了一遍，发现Triton的github repo已经给出了对应的llvm的commit id以及对应的编译细节，然后跟着走了一遍，也顺利的

发表于 02-22 17:04 •2357次阅读

linux服务器和windows服务器

管理工具。这使得Windows服务器更适合那些对服务器操作系统不太熟悉的用户，如小型企业和个人网站的管理员。 Windows服务器还拥有广泛的应用支持。在商业应用领域，很多企业软件和

发表于 02-22 15:46

利用NVIDIA产品技术组合提升用户体验

本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型，并借助NVIDIA Triton推理服务器在NVIDIA V1

发表于 01-17 09:30 •687次阅读

【服务器数据恢复】服务器迁移数据时数据损坏的数据恢复案例

服务器数据恢复环境&服务器故障：一台安装Windows操作系统的服务器。工作人员在迁移该服务器中数据时突然无法读取数据，

发表于 01-16 13:19 •943次阅读

【服务器数据恢复】服务器raid5离线硬盘上线失败的数据恢复案例

服务器数据恢复环境：北京某教育机构一台服务器中有一组由3块磁盘组建的raid5阵列，服务器安装的windows server操作系统。

发表于 01-05 13:46 •527次阅读

搜索历史

NVIDIA Triton 系列文章（5）：安装服务器软件

评论

如何在Windows上设置SFTP服务器

使用zabbix监控云服务器的方法

服务器数据恢复—搬迁导致服务器无法识别raid的数据恢复案例

使用windows版mosquitto软件自建一个服务器

服务器数据恢复—同品牌新老型号服务器raid5阵列数据恢复方法分析

云存储服务器怎么配置

服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

服务器托管和租用区别是什么

使用NVIDIA Triton推理服务器来加速AI预测

服务器远程不上服务器怎么办？服务器无法远程的原因是什么？

在AMD GPU上如何安装和配置triton？

linux服务器和windows服务器

利用NVIDIA产品技术组合提升用户体验

【服务器数据恢复】服务器迁移数据时数据损坏的数据恢复案例

【服务器数据恢复】服务器raid5离线硬盘上线失败的数据恢复案例