0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何利用NVIDIA中的单视角3D追踪功能减轻视觉感知中的遮挡现象?

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-05-17 10:36 766次阅读

说到智能视频分析(IVA)应用(如交通监控、仓库安全和零售消费者分析)的感知,最大的挑战之一就是遮挡。例如,人们可能会移动到结构性障碍物后面,零售消费者可能由于货架而无法被完全看到,汽车可能会被隐藏在大型卡车后面。

本文将介绍如何利用NVIDIA DeepStream SDK中全新的单视角 3D 追踪功能,来解决现实生活中 IVA 部署常见的视觉感知遮挡问题。

视觉感知中的视角和投影

在我们的物理世界中,通过相机镜头观察到的一些物体的运动可能看起来并不稳定,这是由于相机对 3D 世界的 2D 呈现所造成的。

水星和火星等行星的逆行就是一个例子,这让古希腊天文学家感到困惑。他们无法解释为什么行星有时看起来会向后移动(图 1)。

之所以会出现明显退行,是由于恒星和行星在夜空中的轨迹所造成的。这些是宇宙 3D 空间中轨道运动在夜空2D画布上的投影,如果古代天文学家知道3D空间的运动模式,他们就可以预测这些行星在2D夜空中的出现。

8712583e-1380-11ef-b74b-92fbcf53809c.png

图 1. 2014 年(左)和 2016 年(右)

火星在夜空中的逆行运动轨迹(图片来源:NASA)

交通监控摄像头提供了类似的例子。这些摄像头通常用于监测一个大面积的区域,在这个区域里,车辆在近场和远场的运动动态可能截然不同。

在视频 1 中,远处的车辆看起来较小且移动缓慢。当车辆靠近摄像头并转弯时,可以观察到物体运动的突然变化。这些变化使得我们在 2D 摄像机视图中很难找到常见的模式,因此也很难预测车辆未来可能移动的位置。

视频 1. 近场车辆似乎移动得很快,

而远场车辆则移动得较慢

物体跟踪本质上是对物体物理状态的连续估计,同时随着时间的推移来识别其独特身份。该过程通常包括对物体运动动态进行建模和预测,以抑制测量(检测)中的固有干扰。从所提供的示例来看,直接在原生3D空间中对物体状态进行估计和预测显然比在投影的2D 摄像头图像平面中效果更好,这是因为物体存在于3D空间中。

使用 NVIDIA DeepStream进行单视角 3D 跟踪

NVIDIA DeepStream SDK 是一个基于 GStreamer 的完整流媒体分析工具包,可用于基于 AI 的多传感器处理,视频、音频和图像理解。DeepStream 6.4 版本引入了一种名为单视角 3D 跟踪(SV3DT)的新功能,该功能能够在单摄像头视图内估计 3D 物理世界中的物体状态。

这一过程包括使用每个摄像头的 3×4 投影矩阵或摄像头矩阵,将 2D 摄像头图像平面上的观测测量转换为 3D 世界坐标系。物体在3D世界地平面中的位置表示为物体底部的中心,因此,行人被建模为一个立在世界地面平面上的圆柱体(具有高度和半径),圆柱体模型底部的中心是行人的脚部位置(图 2)。

87335f5c-1380-11ef-b74b-92fbcf53809c.png

图 2. 每个圆柱形模型的底部中心表示

每个行人在 3D 世界地平面上的位置(用绿点标记)

使用 3×4 投影矩阵和圆柱形人体模型,可以估算出针对检测到物体的 3D 人体模型在 3D 世界地平面上的位置,从而使投影在 2D 摄像头图像平面上的 3D 人体模型,与检测到的物体的边界框相吻合。

例如,在图 3(左)中,灰色边界框表示对象检测器使用NVIDIA TAO PeopleNet模型检测到的物体,紫色和黄色圆柱体代表从 3D 世界地平面上的估计位置投影到 2D 摄像头图像平面的相应的 3D 人体模型,投影的 3D 人体模型底部的绿点代表预估的脚部位置。尽管摄像头视图有透视和旋转,但这些位置与实际脚部位置非常吻合。

8897f42a-1380-11ef-b74b-92fbcf53809c.png

图 3. SV3DT 有助于跟踪零售消费者准确的脚部位置,

即使存在遮挡也不影响

新推出的 DeepStream SV3DT 功能的一个重要优势是,即使存在明显的局部遮挡,也可以准确地找到物体的 2D 和 3D 脚部位置,而这是现实世界 IVA 应用中最具挑战性的问题之一。

例如,图 3(右)显示了一个人在狭窄的过道里购物,摄像头只能看到其上半身的一小部分,这将导致物体边界框较小,只能捕获头部和肩部区域。在这种情况下,要在全局商店地图上对此人进行定位就变得极具挑战性,至少可以说,估计脚部位置是一项非同小可的任务。

使用边界框的底部中心作为对象位置的代表会为轨迹估计带来很大的误差。即使使用摄像头校准信息将 2D 点转换为 3D 点情况也是如此,尤其是当摄像头透视和旋转较大时。

DeepStream SDK 中的多目标跟踪器模块中的 SV3DT 算法,在假设摄像头安装在头部上方的情况下,通过利用 3D 人体建模信息来解决这个问题。大多数部署在智能空间中的大型摄像头网络系统通常都是这种情况。有了这个假设,在估算相应的 3D 人体模型位置时,就可以使用头部作为锚点。如图 3 显示,即使在人被严重遮挡的情况下,SV3DT 算法也可以成功地找到匹配的 3D 人体模型位置。

视频 2 显示了在一家便利店中对消费者进行跟踪的情况。需要注意的是,所使用的 3×4 投影矩阵没有考虑镜头失真,尽管特定的摄像头有一定的镜头失真,正如您所看到的,水平线有点弯曲而不是直线。这会导致 3D 人体模型位置估计更加不准确,尤其是当人位于视频帧的边缘时。

尽管如此,人们在便利店的 2D 和 3D 脚部位置(用绿点表示)还是被准确而稳健地追踪到了,这也提高了队列长度监控和占用率地图等其他分析的准确性。

图 4 显示了如何在合成数据集中稳健地追踪每个行人的脚部位置,即使下半身的大部分被货架等大型物体遮挡。

88ba9430-1380-11ef-b74b-92fbcf53809c.gif

图 4. 基于合成数据集的严重颗粒遮挡情况下的SV3DT 行人位置跟踪

我们相信,解决部分遮挡问题将为现实应用带来许多可能性。SV3DT 目前处于 Alpha 模式,因为其对象类型支持有限(仅限站立的人),其他情况(如人们坐着和躺着)或其他对象类型可能会在未来的版本中得到支持。

DeepStream SV3DT 用例

该 DeepStream SV3DT 用例演示了如何在本文介绍的零售商店视频上启用单视角 3D 跟踪,并从管道中保存 3D 元数据。如图 4 和视频 2 所示,用户可以从数据中可视化凸起的船体和脚部位置。README 还介绍了如何在定制视频上运行该算法。

总结

NVIDIA DeepStream SDK 中的单视角 3D 跟踪有助于缓解现实生活中 IVA 应用程序和部署的部分遮挡问题。该功能在 6.4 版本中首次推出,并在 7.0 版本中进行了增强。具体而言,SV3DT 能够在局部遮挡的情况下估计脚部位置,并能够进行更稳健和准确的对象追踪,从而实现 3D 地平面中的准确定位。依赖或利用地理空间分析的企业有望从这项技术中受益。

审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2561

    文章

    52333

    浏览量

    762475
  • NVIDIA
    +关注

    关注

    14

    文章

    5199

    浏览量

    105586
  • 摄像头
    +关注

    关注

    60

    文章

    4934

    浏览量

    97524

原文标题:利用 NVIDIA DeepStream 中的单视角 3D 跟踪技术减轻视觉感知中的遮挡现象

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
    相关推荐
    热点推荐

    人形机器人 3D 视觉路线之争:激光雷达、双目和 3D - ToF 谁更胜一筹?

    电子发烧友网报道(文 / 吴子鹏)在人形机器人的设计方案3D 视觉技术是实现环境感知与智能化决策的核心支撑之一。它能够助力人形机器人完成环境感知
    的头像 发表于 04-15 00:14 2225次阅读

    NVIDIA Omniverse Kit 107的安装部署步骤

    NVIDIA Omniverse 是一个模块化平台,使用高级 API 和微服务来构建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 应用。OpenUSD 功能强大的
    的头像 发表于 03-28 10:37 312次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse Kit 107的安装部署步骤

    一种以图像为中心的3D感知模型BIP3D

    在具身智能系统3D感知算法是一个关键组件,它在端侧帮助可以帮助智能体理解环境信息,在云端可以用来辅助生成3D场景和3D标签,具备重要的研
    的头像 发表于 03-17 13:44 289次阅读
    一种以图像为中心的<b class='flag-5'>3D</b><b class='flag-5'>感知</b>模型BIP<b class='flag-5'>3D</b>

    3D打印XPR技术对于打印效果的影响?

    我是3D打印设备的制造商,我想具体了解下3D打印XPR技术对于打印效果的影响? 或者是否能提供对应的专利信息以备查阅
    发表于 02-18 07:59

    机器人3D视觉传感器需求爆发!英特尔、奥比光领跑,百亿市场争夺战开启

    光均在机器人领域实现了产品布局。   视觉传感器主要是利用机器来执行视觉识别和判断任务。目前,主流人形机器人视觉方案包括
    的头像 发表于 02-12 00:12 1977次阅读

    多维精密测量:半导体微型器件的2D&amp;3D视觉方案

    精密视觉检测技术有效提升了半导体行业的生产效率和质量保障。友思特自研推出基于深度学习平台和视觉扫描系统的2D3D视觉检测方案,通过9种深度
    的头像 发表于 01-10 13:54 469次阅读
    多维精密测量:半导体微型器件的2<b class='flag-5'>D</b>&amp;<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>方案

    光学系统的3D可视化

    Results Profile提供有关传播光线的信 息,而后者只显示组件和探测器。 在接下来的使用案例,我们将重点介绍 System:3D视图。 系统:Ray Results Profile的3D
    发表于 01-06 08:53

    TechWiz LCD 3D应用:宾主液晶

    近年来,宾主液晶在汽车显示CDD的视角控制方面被经常研究。 使用宾主液晶功能,用户可以模拟与二色性染料混合的液晶。 1. 建模任务 1.1对比不同电压(宽/窄视角模式)下亮度的分布
    发表于 12-30 08:54

    探索3D视觉技术在活塞杆自动化抓取的应用

    随着工业4.0时代的到来,智能制造成为工业发展的重要趋势。作为智能制造的关键技术之一,3D视觉技术在活塞杆抓取领域的应用前景十分广阔。
    的头像 发表于 09-07 15:38 414次阅读

    使用NVIDIA Edify助力的服务创建3D资产和虚拟环境照明

    使用 NVIDIA Edify 助力的服务创建 3D 资产和虚拟环境照明,或是减半生成图像时间。
    的头像 发表于 08-02 15:22 853次阅读

    3D视觉技术广阔的应用前景

    随着工业自动化领域的迅猛进步,对制造过程抓取作业的精度与效率提出了更为严苛的要求。作为机械构造的核心组件,活塞杆的精准抓取成为了保障产品质量、提升生产效率的关键环节。在此背景下,3D视觉
    的头像 发表于 07-29 15:56 574次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b>技术广阔的应用前景

    OpenCV携奥比3D相机亮相CVPR 2024

    和机器学习软件库,提供丰富的图像处理和计算机视觉算法。奥比光与OpenCV的深入合作,使得复杂的3D感知项目开发变得简单高效。全球开发者及企业用户可借助奥比
    的头像 发表于 06-21 09:38 828次阅读

    苏州吴中区多色PCB板元器件3D视觉检测技术

    3D视觉检测相较于2D视觉检测,有其独特的优势,不受产品表面对比度影响,精确检出产品形状,可以测出高度(厚度)、体积、平整度等。在实际应用
    的头像 发表于 06-14 15:02 650次阅读
    苏州吴中区多色PCB板元器件<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>检测技术

    奥比光英伟达联办3D视觉创新应用竞赛圆满收官

    5月15日,奥比光与NVIDIA(英伟达)联合主办的“2024第四届3D视觉创新应用竞赛”圆满落幕。
    的头像 发表于 05-30 09:37 656次阅读
    奥比<b class='flag-5'>中</b>光英伟达联办<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>创新应用竞赛圆满收官

    天马微电子首发TIANMA META SIGHT光场3D解决方案

    3D显示领域,视角的大小和画面的稳定性一直是行业内的难题,TIANMA META SIGHT 3D光场显示器采用了先进的追踪式超多视点技术
    的头像 发表于 05-23 10:21 747次阅读
    天马微电子首发TIANMA META SIGHT光场<b class='flag-5'>3D</b>解决方案

    有几种电平转换电路,适用于不同的场景

    一.起因一般在消费电路的元器件之间,不同的器件IO的电压是不同的,常规的有5V,3.3V,1.8V等。当器件的IO电压一样的时候,比如都是5V,都是3.3V,那么其之间可以直接通讯,比如拉中断,I2Cdata/clk脚双方直接通讯等。当器件的IO电压不一样的时候,就需要进行电平转换,不然无法实现高低电平的变化。二.电平转换电路常见的有几种电平转换电路,适用于

    张飞实战电子官方
    1天前
    285

    瑞萨RA8系列教程 | 基于 RASC 生成 Keil 工程

    对于不习惯用 e2 studio 进行开发的同学,可以借助 RASC 生成 Keil 工程,然后在 Keil 环境下愉快的完成开发任务。

    RA生态工作室
    05-01 10:00
    538

    共赴之约 | 第二十七届中国北京国际科技产业博览会圆满落幕

    作为第二十七届北京科博会的参展方,芯佰微有幸与800余家全球科技同仁共赴「科技引领创享未来」之约!文章来源:北京贸促5月11日下午,第二十七届中国北京国际科技产业博览会圆满落幕。本届北京科博会主题为“科技引领创享未来”,由北京市人民政府主办,北京市贸促会,北京市科委、中关村管委会,北京市经济和信息化局,北京市知识产权局和北辰集团共同承办。5万平方米的展览云集

    芯佰微电子
    1天前
    627

    道生物联与巍泰技术联合发布 RTK 无线定位系统:TurMass™ 技术与厘米级高精度定位的深度融合

    道生物联与巍泰技术联合推出全新一代 RTK 无线定位系统——WTS-100(V3.0 RTK)。该系统以巍泰技术自主研发的 RTK(实时动态载波相位差分)高精度定位技术为核心,深度融合道生物联国产新兴窄带高并发 TurMass™ 无线通信技术,为室外大规模定位场景提供厘米级高精度、广覆盖、高并发、低功耗、低成本的一站式解决方案,助力行业智能化升级。

    道生物联
    1天前
    497

    智能家居中的清凉“智”选,310V无刷吊扇驱动方案--其利天下

    炎炎夏日,如何营造出清凉、舒适且节能的室内环境成为了大众关注的焦点。吊扇作为一种经典的家用电器,以其大风量、长寿命、低能耗等优势,依然是众多家庭的首选。而随着智能控制技术与无刷电机技术的不断进步,吊扇正朝着智能化、高效化、低噪化的方向发展。那么接下来小编将结合目前市面上的指标,详细为大家讲解其利天下有限公司推出的无刷吊扇驱动方案。▲其利天下无刷吊扇驱动方案一

    其利天下技术
    05-10 16:29
    1.4k

    电源入口处防反接电路-汽车电子硬件电路设计

    一、为什么要设计防反接电路电源入口处接线及线束制作一般人为操作,有正极和负极接反的可能性,可能会损坏电源和负载电路;汽车电子产品电性能测试标准ISO16750-2的4.7节包含了电压极性反接测试,汽车电子产品须通过该项测试。二、防反接电路设计1.基础版:二极管串联二极管是最简单的防反接电路,因为电源有电源路径(即正极)和返回路径(即负极,GND),那么用二极

    张飞实战电子官方
    05-09 19:34
    922

    半导体芯片需要做哪些测试

    首先我们需要了解芯片制造环节做⼀款芯片最基本的环节是设计->流片->封装->测试,芯片成本构成⼀般为人力成本20%,流片40%,封装35%,测试5%(对于先进工艺,流片成本可能超过60%)。测试其实是芯片各个环节中最“便宜”的一步,在这个每家公司都喊着“CostDown”的激烈市场中,人力成本逐年攀升,晶圆厂和封装厂都在乙方市场中“叱咤风云”,唯独只有测试显

    汉通达
    05-09 10:02
    868

    解决方案 | 芯佰微赋能示波器:高速ADC、USB控制器和RS232芯片——高性能示波器的秘密武器!

    示波器解决方案总述:示波器是电子技术领域中不可或缺的精密测量仪器,通过直观的波形显示,将电信号随时间的变化转化为可视化图形,使复杂的电子现象变得清晰易懂。无论是在科研探索、工业检测还是通信领域,示波器都发挥着不可替代的作用,帮助工程师和技术人员深入剖析电信号的细节,精准定位问题所在,为创新与发展提供坚实的技术支撑。一、技术瓶颈亟待突破性能指标受限:受模拟前端

    芯佰微电子
    05-09 10:36
    1.6k

    硬件设计基础----运算放大器

    1什么是运算放大器运算放大器(运放)用于调节和放大模拟信号,运放是一个内含多级放大电路的集成器件,如图所示:左图为同相位,Vn端接地或稳定的电平,Vp端电平上升,则输出端Vo电平上升,Vp端电平下降,则输出端Vo电平下降;右图为反相位,Vp端接地或稳定的电平,Vn端电平上升,则输出端Vo电平下降,Vn端电平下降,则输出端Vo电平上升2运算放大器的性质理想运算

    张飞实战电子官方
    05-08 19:34
    616

    ElfBoard技术贴|如何调整eMMC存储分区

    ELF 2开发板基于瑞芯微RK3588高性能处理器设计,拥有四核ARM Cortex-A76与四核ARM Cortex-A55的CPU架构,主频高达2.4GHz,内置6TOPS算力的NPU,这一设计让它能够轻松驾驭多种深度学习框架,高效处理各类复杂的AI任务。

    ElfBoard
    05-08 15:01
    1.2k

    米尔基于MYD-YG2LX系统启动时间优化应用笔记

    1.概述MYD-YG2LX采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31GPU(500MHz)和视频处理单元(支持H.264硬件编解码),16位的DDR4-1600/DDR3L-1333内存控制器、千兆以太网控制器、USB、CAN、

    米尔电子
    05-08 08:07
    413

    运放技术——基本电路分析

    虚短和虚断的概念由于运放的电压放大倍数很大,一般通用型运算放大器的开环电压放大倍数都在80dB以上。而运放的输出电压是有限的,一般在10V~14V。因此运放的差模输入电压不足1mV,两输入端近似等电位,相当于“短路”。开环电压放大倍数越大,两输入端的电位越接近相等。“虚短”是指在分析运算放大器处于线性状态时,可把两输入端视为等电位,这一特性称为虚假短路,简称

    张飞实战电子官方
    05-07 19:32
    560

    飞凌嵌入式携手中移物联,谱写全国产化方案新生态

    4月22日,飞凌嵌入式“2025嵌入式及边缘AI技术论坛”在深圳成功举办。中移物联网有限公司(以下简称“中移物联”)携OneOS操作系统与飞凌嵌入式共同推出的工业级核心板亮相会议展区,操作系统产品部高级专家严镭受邀作《OneOS工业操作系统——助力国产化智能制造》主题演讲。

    飞凌嵌入式
    05-07 11:26
    1.7k

    ATA-2022B高压放大器在螺栓松动检测中的应用

    实验名称:ATA-2022B高压放大器在螺栓松动检测中的应用实验方向:超声检测实验设备:ATA-2022B高压放大器、函数信号发生器,压电陶瓷片,数据采集卡,示波器,PC等实验内容:本研究基于振动声调制的螺栓松动检测方法,其中低频泵浦波采用单频信号,而高频探测波采用扫频信号,利用泵浦波和探测波在接触面的振动声调制响应对螺栓的松动程度进行检测。通过螺栓松动检测

    Aigtek安泰电子
    05-06 18:44
    1.1k

    MOS管驱动电路——电机干扰与防护处理

    此电路分主电路(完成功能)和保护功能电路。MOS管驱动相关知识:1、跟双极性晶体管相比,一般认为使MOS管导通不需要电流,只要GS电压(Vbe类似)高于一定的值,就可以了。MOS管和晶体管向比较c,b,e—–>d(漏),g(栅),s(源)。2、NMOS的特性,Vgs大于一定的值就会导通,适合用于源极接地时的情况(低端驱动),只要栅极电压达到4V或10V就可以

    张飞实战电子官方
    05-06 19:34
    604