NVAIL合作伙伴携最新机器人研究成果亮相ICRA 2019-电子发烧友网

近日，众多全球顶级机器人学研究人员带着他们的前沿成果，亮相ICRA 2019。麻省理工学院、纽约大学和宾夕法尼亚大学等NVAIL（NVIDIA AI实验室）合作伙伴也参与其中，展示其各自的研究成果——基于NVIDIA平台进行实时推理。

麻省理工学院——变分端到端导航和本地化

作者称，这篇论文灵感来自于人类驾驶员所具有的三个主要特征：（1）在陌生路况中的驾驶能力；（2）在环境中本地化的能力；以及（3）当所感知的内容与地图所示不一致时的推理能力。

人类可以从地图中了解潜在的道路拓扑，并通过基于环境信息的视觉输入来定位。因此，当人们的视觉感知与从定位传感器观察到的信息不一致时，人们可以做出决策。

受人类能力的启发，作者着手开发一种深度学习系统，使自动驾驶汽车能够学习如何使用端到端自动驾驶系统来导航信息。导航信息采用路由和未路由地图的形式，与原始传感数据一起使用，以便在复杂的驾驶环境中进行导航和定位，如下图所示：

该算法从前方、右方和左方的三个摄像头拍摄到的图像，以及无路由的地图图像中获取输入补丁。这些图像被反馈到并行卷积管道，然后合并成完全连接的层，因此该层用于学习高斯混合模型（GMM）而不是转向控制。当可用时，路由地图被反馈到单独的卷积管道中，并与中间完全连接的层合并，以学习用于导航的确定性控制信号。

作者表示，他们的算法能够在不同复杂程度的环境中输出控制，包括直线道路行驶、交叉口以及环形交叉口。该算法被证明可以在车辆遇到未经训练的新道路和交叉路口时发挥作用。

作者还表明，基于GMM的概率控制输出可用于定位车辆，从而减少姿势不确定性并增加其定位置信度。他们首先利用从GPS中获得的姿势进行计算，然后基于该计算结果以及额外的不确定性，计算该姿势的后验概率。根据作者得出结论，如果后验分布的不确定性低于先前分布中的不确定性，则该模型能够增加其定位的置信度。这种预测姿势和降低不确定性的能力，让车辆即使在完全失去GPS信号的情况下也能获得更精确的定位。

该算法在NVIDIA V100 GPU上进行训练，训练一个模型需要3小时。推理则是在安装于配备了线控驱动功能的Toyota Prius中的DRIVE PX2上实时进行的。算法在ROS中实现，并利用NVIDIA DriveWorks SDK与车辆传感器连接。

未来，作者计划以多种方式推动自主化的界限。示例包括让车辆行驶在更多未经明确训练的情况下，理解传感器或模型何时失效，以及发现人何时应该帮助或接管控制。

麻省理工学院是ICRA 2019年度最佳会议论文奖的三名候选人之一。有关本文的概述，您可以查看此视频。

纽约大学——用于自动驾驶高效推理的可重构网络

由于配备大量传感器，自动驾驶车辆会收集到海量的数据，处理这些数据需要大量的计算并训练一个大型网络。为了应对这一挑战，作者引入了一个可重构网络，可以在线预测，在既定的时间内，哪个传感器会提供最相关的数据。这种方法依赖于直觉，即在特定时刻只收集一小部分具有相关性的数据。

可重构网络包括门控网络，该门控网络基于将学习划分为子任务的概念，每个子任务由一位专家（expert）执行。门控网络决定在给定时间点使用哪个专家，这意味着算法将决定使用哪个传感器收集数据。进而，门控网络为避免大量计算成本提供了一种方法。

作者分三个步骤训练可重构网络。首先，专家组件被训练为传感器融合网络，门控网络把它们作为特征提取器，用于选择最相关传感器。其次，创建一个单独但小得多的门控网络，以模拟第一门控网络的行为，并在训练期间在门控网络的输出上实施稀疏性，以使其仅在任何给定时刻只选择一个专家。第三，通过微调专家和完全连接的层来训练可重构网络，同时参考了前一步骤中估计的门控网络的权重。

研究人员训练了两个版本的可重构网络，如下图所示。请注意，Reconf_Select所需的计算较少，因为它使用逐点求和来代替级联，从而将来自专家的特征向量进行合并。

NVAIL合作伙伴携最新机器人研究成果亮相ICRA 2019

可重构网络的两种架构：Reconf_Concat (上方) 和Reconf_Select (下方)

使用NVIDIA GeForce GTX 1080 GPU在70,000个场景上对网络进行训练，大约需要6个小时。该网络在5,738个测试场景上进行了评估，使用相同的GPU进行推理，基于一张图像只需要1秒。从定量分析来看，如测试损失所证明，从同一摄像头选择输入的两个网络版本，可实现与使用来自所有摄像头的输入相同的性能，同时减少三倍的FLOPS计算。

对于车辆测试的实时性，作者在Traxxas X-Maxx遥控卡车上安装了NVIDIA Jetson TX1和三台Logitech HD Pro摄像头。网络必须选择三个摄像头中的一个，来收集室内环境的图像，以用于实时转向命令估计。该算法的在线处理能力超过20帧/秒。

宾夕法尼亚大学——用于移动机器人的集成传感和计算系统

此前，宾夕法尼亚大学在Open Vision Computer (OVC)上发表了一篇论文。OVC是一个开源计算平台，支持高速、视觉引导、GPS拒止和轻量级自主飞行机器人。OVC是与开源机器人基金会合作开发的，它将传感器和计算元素集成到一个软件包中。OVC旨在支持一系列计算机视觉算法，包括视觉惯性测距和立体声，以及包括路径规划和控制在内的自主学习相关算法。

OVC的第一个版本OVC1包含通过PCIe总线连接到计算模块的传感器子系统。传感器子系统包括一对CMOS图像传感器和惯性测量单元（IMU）。计算模块是NVIDIA Jetson TX2，专为计算密集型嵌入式应用而设计，PCIe总线为TX2的统一CPU和GPU内存系统提供直接、高速的接口。

在图像以原始图像从传感器传输到CPU和GPU的一瞬间，系统就可以提取特征。作者表示，该系统还能够处理基于深度学习的应用，如用于目标检测的单发多盒检测器（SSD512）和用于语义分割的ERFNet架构的变体。

搭载TX2模块的OVC1重量不到200克，总功耗低于20瓦。随后，OVC1被安装在重达1.3千克的Falcon 250自主飞行机器人上。该系统能够成功地穿越数百米，避开包括树木和建筑物在内的障碍物，并返回其起始位置，无需GPS信号并基于最小指令。 Falcon 250上的OVC1如下图所示。

Falcon 250自主飞行机器人，配备第一版Open Vision Computer的OVC1

作者还提出了OVC的第二种设计OVC2，旨在缩小外形尺寸并提高性能，如下图所示。OVC2基于TX2，但作者正在考虑使用比TX2性能更优的Jetson Xavier。

基于NVIDIA Jetson TX2的第二版Open Vision Computer OVC2

宾夕法尼亚大学还发表了另一篇论文，展示了一种实时立体深度估计和稀疏深度融合算法，该算法在OVC1上进行处理，并且可实现GPU加速。该算法可将从激光雷达传感器或测距相机获得的稀疏深度信息引入立体深度估计，其基于Middlebury 2014和KITTI 2015基准数据集所表现出的性能优于现有技术水平。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1797

文章
47867

浏览量
240853
自动驾驶

自动驾驶

+关注

关注
785

文章
13954

浏览量
167255

原文标题：NVAIL合作伙伴携最新机器人研究成果亮相ICRA 2019

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

新型复眼结构有望革新机器人视觉系统

的灵敏度较现有市售产品高出两倍以上。这一突破有望革新机器人视觉系统、增强机器人的导航、感知和决策能力，并为人机协作开拓了更广泛的商业应用和未来发展空间。研究团队（香港科技大学）该创新系统模仿生物复眼的视觉

发表于 12-24 10:49 •399次阅读

NVIDIA合作伙伴精彩亮相ROSCon China 2024

刚刚结束的ROSCon China 2024，可以说是机器人技术领域的一场盛宴。本届大会聚焦机器人技术交流与产业前沿趋势分享，结合重点应用场景展示机器人创新应用赋能千行百业。大会期间，众多机器

发表于 12-10 14:58 •336次阅读

共创AI+时代广和通携5G AIoT解决方案智赴2024中国移动全球合作伙伴大会

10月11-13日，以“智焕新生共创AI+时代”为主题的2024中国移动全球合作伙伴大会在广州盛大举行，广和通作为中国移动重要合作伙伴，携一系列5G eMBB、5G RedCap、4G模组及创新AI解决方案

发表于 10-12 09:44 •477次阅读

共创AI+时代 | 广和通携5G AIoT解决方案智赴2024中国移动全球合作伙伴大会

10月11-13日，以“智焕新生共创AI+时代”为主题的2024中国移动全球合作伙伴大会在广州盛大举行，广和通作为中国移动重要合作伙伴，携一系列5G eMBB、5G RedCap、4G模组及创新AI解决方案

发表于 10-12 09:43 •744次阅读

NVIDIA在ICRA展示最新机器人研究

在日前举行的 IEEE 国际机器人和自动化大会（ICRA）上，几何织物（geometric fabrics）成为一个热门的讨论话题。几何织物是 NVIDIA 机器人研究实验室成员与

发表于 10-10 09:55 •426次阅读

地瓜机器人与广和通深度合作，共驱智能机器人商用落地

9月20日，2024地瓜机器人开发者日暨新品发布在深圳顺利举办。广和通作为地瓜机器人官方授权硬件IDH合作伙伴，受邀出席大会并展示了一系列基于地瓜旭日5的机器人解决方案及客户终端，双方

发表于 09-23 16:27 •396次阅读

地瓜机器人与广和通深度合作，共驱智能机器人商用落地

9月20日，2024地瓜机器人开发者日暨新品发布在深圳顺利举办。广和通作为地瓜机器人官方授权硬件IDH合作伙伴，受邀出席大会并展示了一系列基于地瓜旭日5的机器人解决方案及客户终端，双方

发表于 09-23 16:27 •567次阅读

智焕新生共创AI+时代丨利尔达将携多款明星产品亮相中国移动全球合作伙伴大会

合作伙伴大会。作为中国移动重要合作伙伴之一，利尔达（证券代码832149）将携多款备受业内关注的新品在本次大会4E19号展位亮相。中国移动全球合作伙

发表于 09-21 08:04 •400次阅读

软通动力与智元机器人携手亮相世界机器人大会

应用解决方案服务商与制造商，软通动力携人形机器人关键能力，与战略合作伙伴智元机器人以联展的形式亮相本届大会。大会现场，软通动力展示了自身在

发表于 08-22 13:12 •517次阅读

亚马逊云科技升级“3+1”合作伙伴战略与合作伙伴共赴新征程

北京2024年5月31日 /美通社/ -- 亚马逊云科技中国合作伙伴峰会在上海召开。峰会上，亚马逊云科技升级推出“3+1”合作伙伴战略，聚焦生成式AI、专注行业和业务拓展三大业务战略，并提供一系列赋

发表于 06-11 10:05 •708次阅读

入围全球机器人顶会ICRA 2024！毫末在RoboDrive2024挑战赛崭露头角

技术方案，分享了如何通过创新技术解决自动驾驶感知中的复杂问题。 2024年5月13日至17日，ICRA 2024 在日本横滨举办。ICRA 汇集了来自世界各地的机器人研究人员、学生和工

发表于 05-17 10:32 •492次阅读

YOGO ROBOT携AI机器人亮相2024C3不动产运营及服务高峰论坛

3月22日，“破界立新·汇智聚力”2024C3不动产运营及服务高峰论坛在上海召开，YOGO ROBOT携递送机器人、安防机器人、空净机器人等产品亮相

发表于 03-27 11:30 •1053次阅读

因聚而生，数智有为——神州鲲泰携重磅新品亮相华为中国合作伙伴大会2024

大会已经成为业界展示最新科技创新成果、增进伙伴了解共识、推动产业合作共赢的大舞台。作为华为全面深化战略合作伙伴，神州数码携多款产品及解决方案

发表于 03-18 17:53 •749次阅读

软通动力携前沿数智化技术成果亮相华为中国合作伙伴大会2024

3月14日，以“因聚而生数智有为”为主题的“华为中国合作伙伴大会2024”在深圳隆重开幕。

发表于 03-15 10:31 •599次阅读

因聚而生数智有为丨软通动力携子公司鸿湖万联亮相华为中国合作伙伴大会2024

3月14日，以“因聚而生数智有为”为主题的“华为中国合作伙伴大会2024”在深圳隆重开幕。作为华为的重要合作伙伴和本次大会钻石级（最高级）合作伙伴，软通动力深度参与本次盛会，携前沿数智

发表于 03-15 09:56 •643次阅读