0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI与机器人实验室联合发布的最新研究结果,效果可媲美LiDAR

DPVg_AI_era 来源:lp 2019-04-23 10:59 次阅读

视频中估计3D结构和相机运动是计算机视觉中的一个关键问题,这个技术在自动驾驶领域有着广阔的工业应用前景。今日,谷歌AI机器人实验室联合发布的最新成果:无需相机参数、单目、以无监督学习的方式从未标记场景视频中搞定深度图,效果堪比激光雷达。

目前自动驾驶的核心技术是LiDAR(激光雷达),一种运用雷达原理,采用光和激光作为主要传感器的汽车视觉系统。LiDAR传感器赋予了自动驾驶汽车能够看到周边环境的“双眼”,激光雷达技术越先进,视觉感知的精准程度越高,这是自动驾驶得以实现的底层技术基础。

但是最近几年,放在摄像头上的深度学习研究,发展很蓬勃。相比之下, 虽然激光雷达 (LiDAR)的数据有诸多优点,但相关学术进展并不太多。相机+数据+神经网络的组合,正在迅速缩小与LiDAR的能力差距。

无需相机参数、单目、以无监督学习的方式从未标记场景视频中搞定深度图!

这是谷歌AI与机器人实验室联合发布的最新研究结果,效果可媲美LiDAR。

什么是深度图?

深度图像(depth image)也被称为距离影像(range image),由相机拍摄,是指将从图像采集器到场景中各点的距离(深度)作为像素值的图像,它直接反映了景物可见表面的几何形状。单位为mm,效果参考下图:

在场景视频景深学习领域,谷歌AI和机器人实验室联合公布了三项最新研究突破:

第一,证明了可以以一种无监督的方式训练深度网络,这个深度网络可以从视频本身预测相机的内在参数,包括镜头失真(见图1)。

第二,在这种情况下,他们是第一个以几何方式从预测深度直接解决遮挡的问题。

第三,大大减少了处理场景中移动元素所需的语义理解量:只需要一个覆盖可能属于移动对象的像素的单个掩码,而不是分割移动对象的每个实例并跨帧跟踪它。

图1:从未知来源的视频中学习深度的方法的定性结果,通过同时学习相机的外在和内在参数来实现。由于该方法不需要知道相机参数,因此它可以应用于任何视频集。所有深度图(在右侧可视化,作为差异)都是从原始视频中学习而不使用任何相机内在函数。从上到下:来自YouTube8M的帧,来自EuRoC MAV数据集,来自Cityscapes和来自KITTI的帧。

推特网友对此不吝赞美:“这是我见过的最令人印象深刻的无监督结果之一。来自未标记视频的深度图对于自动驾驶非常有用:)“

以下是论文具体内容:

从视频中估计3D结构和相机运动是计算机视觉中的一个关键问题,这个技术在自动驾驶领域有着广阔的工业应用前景。

解决该问题的传统方法依赖于在多个连续帧中识别场景中的相同点,并求解在这些帧上最大程度一致的3D结构和相机运动。

但是,帧之间的这种对应关系只能针对所有像素的子集建立,这导致了深度估计不确定的问题。与通常处理逆问题一样,这些缺口是由连续性和平面性等假设填充的。

深度学习能够从数据中获得这些假设,而不是手工指定这些假设。在信息不足以解决模糊性的地方,深度网络可以通过对先前示例进行归纳,以生成深度图和流场。

无监督方法允许单独从原始视频中学习,使用与传统方法类似的一致性损失,但在训练期间对其进行优化。在推论中,经过训练的网络能够预测来自单个图像的深度以及来自成对或更长图像序列的运动。

随着对这个方向的研究越来越有吸引力,很明显,物体运动是一个主要障碍,因为它违反了场景是静态的假设。已经提出了几个方向来解决该问题,包括通过实例分割利用对场景的语义理解。

遮挡是另一个限制因素,最后,在此方向的所有先前工作中,必须给出相机的内在参数。这项工作解决了这些问题,因此减少了监督,提高了未标记视频的深度和运动预测质量。

首先,我们证明了可以以一种无监督的方式训练深度网络,这个深度网络从视频本身预测相机的内在参数,包括镜头失真(见图1)。

其次,在这种情况下,我们是第一个以几何方式从预测深度直接解决遮挡的问题。

最后,我们大大减少了处理场景中移动元素所需的语义理解量:我们需要一个覆盖可能属于移动对象的像素的单个掩码,而不是分割移动对象的每个实例并跨帧跟踪它。

这个掩模可能非常粗糙,实际上可以是矩形边界框的组合。获得这样的粗糙掩模是一个简单得多的问题,而且与实例分割相比,使用现有的模型可以更可靠地解决这个问题。

除了这些定性进展之外,我们还对我们的方法进行了广泛的定量评估,并发现它在多个广泛使用的基准数据集上建立了新的技术水平。将数据集汇集在一起,这种能力通过我们的方法得到了极大的提升,证明可以提高质量。

表1:总结了在KITTI上训练的模型和评估结果,使用给定相机内建和学习相机内建两种方式来评估我们方法的深度估计,结果显而易见,我们获得了当前最佳SOTA。

表2:总结了在Cityscapes上训练和测试的模型的评估结果,我们的方法优于以前的方法,并从学习的内建中获益。

表3:深度估计的消融实验。在所有实验中,训练集是Cityscapes(CS)和KITTI组合,我们分别在Cityscapes(CS)和KITTI(Eigen partition)上测试模型。每行代表一个实验,其中与主方法相比进行了一次更改,如“实验”行中所述。数字越小越好。

除了这些定性的进步,我们对我们的方法进行了广泛的定量评估,发现它在多个广泛使用的基准数据集上建立了一个新的技术状态。将数据集集中在一起,这种方法大大提高了数据集的质量。

最后,我们首次演示了可以在YouTube视频上学习深度和相机内在预测,这些视频是使用多个不同的相机拍摄的,每个相机的内建都是未知的,而且通常是不同的。

来自YouTube8M收集的图像和学习的视差图。

论文摘要

《场景视频景深学习——非特定相机单眼图片景深无监督学习》

我们提出了一种新颖的方法,仅使用相邻视频帧的一致性作为监督信号,用于同时学习单眼视频的深度,运动,物体运动和相机内建。与先前的工作类似,我们的方法通过将可微变形应用于帧,并将结果与相邻结果进行比较来学习,但它提供了若干改进:我们直接使用在训练期间预测的深度图,以几何和可微的方式处理遮挡。我们介绍了随机层标准化,一种新颖的强大正则化器,并考虑了目标相对于场景的运动。据我们所知,我们的工作是第一个以无监督的方式从视频中学习相机固有参数(包括镜头失真)的工作,从而使我们能够从规模未知原点的任意视频中提取准确的深度图和运动信息。

我们在Cityscapes,KITTI和EuRoC数据集上评估我们的结果,建立深度预测和测距的新技术水平,并定性地证明,深度预测可以从YouTube上的一系列视频中学到。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2551

    文章

    51156

    浏览量

    754061
  • 谷歌
    +关注

    关注

    27

    文章

    6171

    浏览量

    105466
  • 自动驾驶
    +关注

    关注

    784

    文章

    13836

    浏览量

    166521

原文标题:谷歌AI:根据视频生成深度图,效果堪比激光雷达

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌公布机器人研究细节 软件如何支持机器人互相学习?

    据AFR报道,谷歌本周公布了机器人研究细节,详细介绍其软件如何支持机器人互相学习。为了证明其技术,谷歌科学家展示了视频,显示
    发表于 10-09 14:05 1239次阅读

    代替人类完成危险性较大实验的双臂机器人——Mahoro

    ` 由日本自电机巨头安川株式会社和日本国立先进工业技术(AIST)研发一款机器人Mahoro。它可以代替人类成为实验室的操作人员。不像以往的机器人,Mahoro拥有7个关节,这样可以让它像人类那样
    发表于 01-22 14:42

    如何建设机器人实验室

    欢迎大家提供一些机器人实验室建设的建议,比如硬件设备、软件、元器件和常用工具的需求。有清单更好。 多谢!
    发表于 03-01 09:19

    LabVIEW 的Tripod 机器人视觉处理和定位研究

    为对几何体的识别和抓放过程ꎮ利用边缘提取、滤波去噪、圆心检测等算法采用LabVIEW视觉模块及其库函数进行了图像的预处理、特征提取以及中心点定位ꎮ研究结果表明基于LabVIEW的Tripod机器人系统能够准确识别平台几何体的颜色和形状
    发表于 06-01 06:00

    【HarmonyOS HiSpark AI Camera】基于Hi3516DV300的机器人集群系统

    项目名称:基于Hi3516DV300的机器人集群系统试用计划:申请理由本人所在实验室为重庆大学机器人协同创新实验室,一直开展机器人领域相关
    发表于 10-29 14:20

    机器人视觉系统研究

    视觉系统成为研究的新课题。1965年, Stanford建立机器人实验室开始研究机器人机器人
    发表于 09-07 08:37

    基于DSP和FPGA的四关节实验室机器人控制器的研制

    机器人学的研究领域中,如何有效地提高机器人控制系统的控制性能始终是研究学者十分关注的一个重要内容。在分析了工业机器人的发展历程和
    发表于 09-01 11:25 11次下载
    基于DSP和FPGA的四关节<b class='flag-5'>实验室</b><b class='flag-5'>机器人</b>控制器的研制

    英特尔携手今日头条成立技术创新联合实验室

    近日,英特尔公司联合今日头条在北京召开了以“数据赋能AI正当时”为主题联合发布会,双方宣布成立技术创新联合实验室
    的头像 发表于 08-24 15:50 3312次阅读

    NVIDIA在西雅图开设机器人研究实验室,聚集跨学科研究团队

    NVIDIA今天在西雅图开设了机器人研究实验室,该实验室将容纳50名机器人专家、20名来自NVIDIA的
    发表于 01-13 09:51 672次阅读

    英伟达机器人实验室专注于厨房辅助机器人等10多个项目

    最近,计算机显卡霸主“英伟达”在西雅图开设了一个机器人实验室,后者将容纳50名机器人专家、20名英伟达研究员以及其他更广泛的学术研究团体。
    发表于 01-14 15:38 2515次阅读

    香港高校与小i机器人共建“机器学习和认知推理联合实验室

    3月25日,香港科技大学联合小i机器人共同成立的“机器学习和认知推理联合实验室”举办揭幕仪式,香港科技大学副校长叶玉如教授、工学院院长郑光廷
    发表于 03-26 13:32 676次阅读

    机械工业机器人试验验证技术重点实验室顺利通过验收

    机械工业机器人试验验证技术重点实验室是中国机械工业联合会于2016年8月批准建设的第六批机械工业重点实验室之一。
    的头像 发表于 11-25 14:23 3127次阅读

    NVIDIA西雅图机器人技术研究实验室负责人是谁?

    Fox是公司机器人研究高级主管、NVIDIA西雅图机器人技术研究实验室负责人,同时在华盛顿大学的保罗·艾伦计算机科学与工程学院(UW Rob
    的头像 发表于 06-09 16:05 2374次阅读

    IBM推新型工业化学实验室机器人远程访问实验室

    IBM已经推出了一种名为RoboRXN的新型工业化学实验室机器人,称其为“第一个远程访问的自治化学实验室”。
    的头像 发表于 09-08 09:56 2678次阅读

    晶泰科技携手ABB机器人打造柔性智能自动化的实验室

    晶泰科技与ABB机器人联合打造柔性自动化、智能化的未来实验室,让自动化设备成为科研的手中利器,成为突破各科研领域效率瓶颈的日常工具。
    的头像 发表于 01-19 16:49 1184次阅读