在目前深度学习中比较普及的“物件检测”应用-电子发烧友网

接下来的重点，就是在目前深度学习中比较普及的“物件检测”应用，重点主要有以下三部分：

1. 简单说明“物件检测”的内容。

2. 使用本项目的 detecnet 物件分类指令，进行多样化的推理识别测试。

3. 深入说明 jetson.inference 模块的 detectNet（）以及相关的函数用法。

如此让大家能快速掌握这项物件检测功能，以及开发代码的重点。

物件检测（object detection）简单说明

这是比图像分类更进一步的应用，因为日常生活中，在绝大部分可看到的画面中，不会只存在一个物体，通常是多种类别的多个物体，左图识别出有“四个人”、右图识别出“一个人与一匹马”，当然真的要细部再探索的话，还有其他类别的物体也可以被识别，这是视觉类深度学习中使用频率最高的一种应用。

在物件检测的识别中，还只是比较“概略性”地将物体用“矩形框”的方式来标识，那能不能将物体的“实际形状”更细腻地标识出来呢？当然可以，这就是更高阶的“语义分割”应用，留在下一篇文章里面说明。

前面的图像分类是以“一张图像”为单位，这里的物件检测则是以“物件框”为单位，因此所需要的数据集就不仅仅是图像了，还要将图像中所需要的类别加以标注，然后存成特定格式之后，提供给训练框架去进行模型训练，这是相当耗费人力的一个过程，而且标注的细腻程度也会对最终的精确度产生影响。

关于这个模型的训练过程，会在后面的文章中带着大家动手做一次，这也是整个 Hello AI World 项目中的一部分，而且也提供非常好用的工具，协助大家采集数据、标注物件框、进行模型训练等。

以上就是物件检测的简单说明，接下去直接使用项目提供的 detectnet 指令来进行实验。

detectnet 指令的使用

与 imagenet 的调用逻辑是一样的，当系统编译好之后，就生成 detectnet 指令，可以在 Jetson 设备中任何地方调用。同样的，项目也为 detectnet 准备了几个预训练好的网络模型，可以非常轻松地调用，预训练模型。

系统预设的神经网络是 “SSD-Mobilenet-v2”，基于 91 种分类的 COCO 数据集进行模型训练，详细的类别内容可以参考 ~/jetson-inference/data/networks 目录下的ssd_coco_labels.txt，事实上能识别的物件有 90 种，另外加一个 “unlabeled” 种类。

detectnet 的参数调用与 imagenet 几乎一致，输入源与输出标的的支持方式完全相同，因此我们可以执行下面指令，直接看看得到怎样的效果：

在执行过程中，会看到命令终端不断出现类似下图的信息，里面显示一些重要的信息，包括“使用的网络模型文件”、“4 个执行阶段占用时间”、“检测到满足阈值的物件数”、“物件类别/置信度”，以及“物件位置”等信息。

detectnet 也能导出 RTP 视频流到指定的电脑，详细用法请参考前面 “Utils的videoOutput 工具”一文中有详细说明，这个用法的实用度非常高，可以让你将 Jetson Nano 2GB 设备放置在任何能接网络的角落，不断读取摄像头内容在 Jetson 上执行物件识别，然后将结果传输到你的桌面电脑或笔记本上，这样你就可以非常轻松地进行监控。

输入 “detectnet --help” 可以得到完整的帮助信息，由于内容太多，我们在这里不占用篇幅去说明，多尝试一些指令的组合，会让你进一步掌握这个指令的重点。

接下来看看如何在 Python 代码中，调用这个项目的物件检测函数，来开发自己的物件检测应用。

detectNet（）函数的用法

与前面图像分类的逻辑一样，作者虽然在 ~/jetson-inference/python/examples 下面提供了一个 my-detection.py 范例，这个就是我们一开始所示范的“ 10 行代码威力”的内容，这个范例的好处是“代码量最少”，但对应的缺点就是“弹性小、完整度不够”，因此从务实的角度，我们还是推荐以 /usr/local/bin/detect.py 这只代码为主，这只代码能执行的功能，与 detectnet 指令几乎一致。

与 imagenet.py 代码相同的，一开始有一段“参数解析”的指令，如下截图：

这部分同样请参考先前的“参数解析功能”文章，在这里不重复赘述。接下来我们将与物件检测有关的指令挑出来说明，这样可以让读者更加容易将焦点集中在有关的部分：

51 行：net = jetson.inference.detectNet（opt.network， sys.argv， opt.threshold）

用 jetson.inferene.detectNet（）函数建立 net 这个物件检测对象，与前面的 imageNet（）的逻辑是一样的，不过这里所输入的参数，除了 network（网络模型类别）之外，还多了一个 threshold（阈值）。因为物件检测的功能，是要在图像中识别出“所有可能”的物件，如果没有一个“最低门槛”的限制，就会满屏都是物件。

系统已经给这两个参数都提供预设值，network 预设为 “SSD-Mobilenet-v2”、threshold 预设值为 0.5。

如果要在代码外部利用参数去改变设定，就可以如以下方式：

--network=multiped，表示要使用“Multiped-500”这个网络模型

--threshold=0.3，表示将阈值改成0.3

这样 net 对象就具备了执行物件检测的相关功能，然后再继续以下的步骤。

63 行：detections = net.Detect（img， overlay=opt.overlay）

这道指令，就是将 input.Capture（）获取的一帧图形，传入 net.Detect（）函数去执行物件检测的推理识别计算，另一个参数 “overlay” 的功能是“检测覆盖”的一个标识，只影响显示输出的方式，与检测结果并没有关系，大部分时候都不需要去改变。

这里最重要的是 detections 这个数组变量，由于每帧图像所检测出来物件数量是不固定的，数组的结构在说明文件中并未完整表达，因此需要从执行的代码中去找到蛛丝马迹，这个部分在下一道指令中可以找到答案。

66~69 行：

print（“detected {：d} objects in image”.format（len（detections）））

for detection in detections：

print（detection）

这部分执行完之后，会在命令终端上显示两个很重要的信息：

本帧图像所找到满足阈值的物件数量。

前面变量detections的数据结构。

在命令终端执行以下指令，

看看所显示的信息，如下截屏：

这里可以看到，代码最后面 “len（detections）” 的值，就是本帧图像所检测到的物件数量，而 detections 的数据结构就是：

ClassID：类别编号

Confidence：置信度

Left：标框左坐标

Top：标框上坐标

Right：标框右坐标

Bottom：标框下坐标

Width：框的宽度 = Right - Left

Height：框的高度 = Bottom - Top

Area：面积 = Width x Height

Center：中心点坐标 = （（Left+Right）/2，（Top+Bottom）/2 ）

确认了 net.Detect（）返回值之后，就能很轻易地以这些数据去开发满足特定要求的应用。

至于后面的 output.Render（img）、output.Status（）这些函数，在前面的文章里面都讲解的很清楚，这里不再重复。

到这里，要利用 Hello AI World 这个项目所提供的库资源，去开发自己的应用程序，就显得非常简单了。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

函数

函数

+关注

关注
3

文章
4333

浏览量
62691
代码

代码

+关注

关注
30

文章
4791

浏览量
68688
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24723
深度学习

深度学习

+关注

关注
73

文章
5504

浏览量
121222

原文标题：Jetson Nano 2GB 系列文章（23）： “Hello AI World 的物件识别应用

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

GPU在深度学习中的应用 GPUs在图形设计中的作用

随着人工智能技术的飞速发展，深度学习作为其核心部分，已经成为推动技术进步的重要力量。GPU（图形处理单元）在深度学习中扮演着至关重要的角色，

发表于 11-19 10:55 •550次阅读

NPU在深度学习中的应用

随着人工智能技术的飞速发展，深度学习作为其核心驱动力之一，已经在众多领域展现出了巨大的潜力和价值。NPU（Neural Processing Unit，神经网络处理单元）是专门为深度

发表于 11-14 15:17 •637次阅读

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是深度

发表于 10-27 11:13 •404次阅读

FPGA做深度学习能走多远？

今天给大侠带来在FPAG技术交流群里平时讨论的问题答疑合集（十四），以后还会多推出本系列，话不多说，上货。 FPGA技术交流群目前已有十多个群，QQ和微信均覆盖，有需要的大侠可以进群，一起交流学习

发表于 09-27 20:53

深度学习算法在嵌入式平台上的部署

随着人工智能技术的飞速发展，深度学习算法在各个领域的应用日益广泛。然而，将深度学习算法部署到资源受限的嵌入式平台上，仍然是一个具有挑战性的任

发表于 07-15 10:03 •1460次阅读

深度学习在工业机器视觉检测中的应用

随着深度学习技术的快速发展，其在工业机器视觉检测中的应用日益广泛，并展现出巨大的潜力。工业机器视觉检测是工业自动化领域的重要组成部分，通过图

发表于 07-08 10:40 •1090次阅读

基于深度学习的无人机检测与识别技术

随着无人机技术的快速发展，无人机在军事、民用、商业等多个领域的应用日益广泛。然而，无人机的广泛使用也带来了诸多挑战，如空域安全、隐私保护等问题。因此，开发高效、准确的无人机检测与识别技术显得尤为重要。本文将深入探讨基于深度

发表于 07-08 10:32 •1274次阅读

基于AI深度学习的缺陷检测系统

在工业生产中，缺陷检测是确保产品质量的关键环节。传统的人工检测方法不仅效率低下，且易受人为因素影响，导致误检和漏检问题频发。随着人工智能技术的飞速发展，特别是深度

发表于 07-08 10:30 •1465次阅读

深度学习在视觉检测中的应用

能力，还使得机器能够模仿人类的某些智能行为，如识别文字、图像和声音等。深度学习的引入，极大地推动了人工智能技术的发展，特别是在图像识别、自然语言处理、语音识别等领域取得了显著成果。

发表于 07-08 10:27 •741次阅读

基于深度学习的小目标检测

在计算机视觉领域，目标检测一直是研究的热点和难点之一。特别是在小目标检测方面，由于小目标在图像中所占比例小、特征不明显，使得

发表于 07-04 17:25 •912次阅读

TensorFlow与PyTorch深度学习框架的比较与选择

深度学习作为人工智能领域的一个重要分支，在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中，

发表于 07-02 14:04 •979次阅读

深度解析深度学习下的语义SLAM

随着深度学习技术的兴起，计算机视觉的许多传统领域都取得了突破性进展，例如目标的检测、识别和分类等领域。近年来，研究人员开始在视觉SLAM算法中引入深

发表于 04-23 17:18 •1305次阅读

深度学习检测小目标常用方法

深度学习的效果在某种意义上是靠大量数据喂出来的，小目标检测的性能同样也可以通过增加训练集中小目标样本的种类和数量来提升。

发表于 03-18 09:57 •732次阅读

【技术科普】主流的深度学习模型有哪些？AI开发工程师必备！

深度学习在科学计算中获得了广泛的普及，其算法被广泛用于解决复杂问题的行业。所有深度学习算法都使用

发表于 01-30 15:26 •636次阅读

基于机器视觉和深度学习的焊接质量检测系统

基于机器视觉和深度学习的焊接质量检测系统是一种创新性的技术解决方案，它结合了先进的计算机视觉和深度学习算法，用于实时监测和评估焊接过程中的焊

发表于 01-18 17:50 •825次阅读

搜索历史

在目前深度学习中比较普及的“物件检测”应用

评论

GPU在深度学习中的应用 GPUs在图形设计中的作用

NPU在深度学习中的应用

GPU深度学习应用案例

FPGA做深度学习能走多远？

深度学习算法在嵌入式平台上的部署

深度学习在工业机器视觉检测中的应用

基于深度学习的无人机检测与识别技术

基于AI深度学习的缺陷检测系统

深度学习在视觉检测中的应用

基于深度学习的小目标检测

TensorFlow与PyTorch深度学习框架的比较与选择

深度解析深度学习下的语义SLAM

深度学习检测小目标常用方法

【技术科普】主流的深度学习模型有哪些？AI开发工程师必备！

基于机器视觉和深度学习的焊接质量检测系统