0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

场景视频景深学习领域,谷歌AI公布三项最新研究突破

ml8z_IV_Technol 来源:YXQ 2019-04-29 15:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从视频中估计3D结构和相机运动是计算机视觉中的一个关键问题,这个技术在自动驾驶领域有着广阔的工业应用前景。目前自动驾驶的核心技术是LiDAR(激光雷达),一种运用雷达原理,采用光和激光作为主要传感器的汽车视觉系统。LiDAR传感器赋予了自动驾驶汽车能够看到周边环境的“双眼”,激光雷达技术越先进,视觉感知的精准程度越高,这是自动驾驶得以实现的底层技术基础。但是最近几年,放在摄像头上的深度学习研究,发展很蓬勃。相比之下, 虽然激光雷达 (LiDAR)的数据有诸多优点,但相关学术进展并不太多。相机+数据+神经网络的组合,正在迅速缩小与LiDAR的能力差距。

无需相机参数、单目、以无监督学习的方式从未标记场景视频中搞定深度图

什么是深度图?

深度图像(depth image)也被称为距离影像(range image),由相机拍摄,是指将从图像采集器到场景中各点的距离(深度)作为像素值的图像,它直接反映了景物可见表面的几何形状。单位为mm,效果参考下图:

在场景视频景深学习领域,谷歌AI机器人实验室联合公布了三项最新研究突破:

第一,证明了可以以一种无监督的方式训练深度网络,这个深度网络可以从视频本身预测相机的内在参数,包括镜头失真(见图1)。

第二,在这种情况下,他们是第一个以几何方式从预测深度直接解决遮挡的问题

第三,大大减少了处理场景中移动元素所需的语义理解量只需要一个覆盖可能属于移动对象的像素的单个掩码,而不是分割移动对象的每个实例并跨帧跟踪它。

图1:从未知来源的视频中学习深度的方法的定性结果,通过同时学习相机的外在和内在参数来实现。 由于该方法不需要知道相机参数,因此它可以应用于任何视频集。 所有深度图(在右侧可视化,作为差异)都是从原始视频中学习而不使用任何相机内在函数。 从上到下:来自YouTube8M的帧,来自EuRoC MAV数据集,来自Cityscapes和来自KITTI的帧。

推特网友对此不吝赞美:“这是我见过的最令人印象深刻的无监督结果之一。来自未标记视频的深度图对于自动驾驶非常有用:)“

以下是论文具体内容:

从视频中估计3D结构和相机运动是计算机视觉中的一个关键问题,这个技术在自动驾驶领域有着广阔的工业应用前景。

解决该问题的传统方法依赖于在多个连续帧中识别场景中的相同点,并求解在这些帧上最大程度一致的3D结构和相机运动。

但是,帧之间的这种对应关系只能针对所有像素的子集建立,这导致了深度估计不确定的问题。与通常处理逆问题一样,这些缺口是由连续性和平面性等假设填充的。

深度学习能够从数据中获得这些假设,而不是手工指定这些假设。在信息不足以解决模糊性的地方,深度网络可以通过对先前示例进行归纳,以生成深度图和流场。

无监督方法允许单独从原始视频中学习,使用与传统方法类似的一致性损失,但在训练期间对其进行优化。在推论中,经过训练的网络能够预测来自单个图像的深度以及来自成对或更长图像序列的运动。

随着对这个方向的研究越来越有吸引力,很明显,物体运动是一个主要障碍,因为它违反了场景是静态的假设。已经提出了几个方向来解决该问题,包括通过实例分割利用对场景的语义理解。

遮挡是另一个限制因素,最后,在此方向的所有先前工作中,必须给出相机的内在参数。这项工作解决了这些问题,因此减少了监督,提高了未标记视频的深度和运动预测质量。

首先,我们证明了可以以一种无监督的方式训练深度网络,这个深度网络从视频本身预测相机的内在参数,包括镜头失真(见图1)。

其次,在这种情况下,我们是第一个以几何方式从预测深度直接解决遮挡的问题。

最后,我们大大减少了处理场景中移动元素所需的语义理解量:我们需要一个覆盖可能属于移动对象的像素的单个掩码,而不是分割移动对象的每个实例并跨帧跟踪它。

这个掩模可能非常粗糙,实际上可以是矩形边界框的组合。获得这样的粗糙掩模是一个简单得多的问题,而且与实例分割相比,使用现有的模型可以更可靠地解决这个问题。

除了这些定性进展之外,我们还对我们的方法进行了广泛的定量评估,并发现它在多个广泛使用的基准数据集上建立了新的技术水平。将数据集汇集在一起,这种能力通过我们的方法得到了极大的提升,证明可以提高质量。

表1:总结了在KITTI上训练的模型和评估结果,使用给定相机内建和学习相机内建两种方式来评估我们方法的深度估计,结果显而易见,我们获得了当前最佳SOTA。

表2:总结了在Cityscapes上训练和测试的模型的评估结果,我们的方法优于以前的方法,并从学习的内建中获益。

表3:深度估计的消融实验。 在所有实验中,训练集是Cityscapes(CS)和KITTI组合,我们分别在Cityscapes(CS)和KITTI(Eigen partition)上测试模型。 每行代表一个实验,其中与主方法相比进行了一次更改,如“实验”行中所述。 数字越小越好。

除了这些定性的进步,我们对我们的方法进行了广泛的定量评估,发现它在多个广泛使用的基准数据集上建立了一个新的技术状态。将数据集集中在一起,这种方法大大提高了数据集的质量。

最后,我们首次演示了可以在YouTube视频上学习深度和相机内在预测,这些视频是使用多个不同的相机拍摄的,每个相机的内建都是未知的,而且通常是不同的。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111992
  • LIDAR
    +关注

    关注

    11

    文章

    368

    浏览量

    31603

原文标题:谷歌AI:根据视频生成深度图,效果堪比激光雷达

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为联合运营商和高校在数据通信领域获得三项荣誉

    结果正式公布,华为联合运营商和高校申报的3案例获奖,充分体现了SNAI推委会和业界对华为在自智网络领域领先性及商业成果的高度认可。
    的头像 发表于 04-21 10:44 253次阅读
    华为联合运营商和高校在数据通信<b class='flag-5'>领域</b>获得<b class='flag-5'>三项</b>荣誉

    优必选再次领衔三项具身智能人形机器人国家标准正式获批

      近日,优必选再次领衔,三项具身智能人形机器人国家标准正式获批。至此,优必选已累计牵头制定六具身智能人形机器人国家标准。2025年优必选已牵头制定作业操作、定位导航、人机交互三项具身智能人形机器人技术要求标准,2026年再添
    的头像 发表于 04-16 10:53 463次阅读

    中兴通讯斩获GTI Awards 2026三项大奖

    近日,全球TD-LTE 倡议组织(GTI)年度大奖正式揭晓,中兴通讯凭借在智能制造、无线网络技术、智能终端领域的前沿创新成果,一举斩获移动人工智能应用奖、创新技术突破奖、创新产品与解决方案奖
    的头像 发表于 03-09 14:48 3017次阅读

    共达电声牵头起草的三项团体标准获批发布

    口协同工作技术要求》(T/CAMAA 030-2025)以及《USB充电模块电磁兼容性与接口技术要求》(T/CAMAA 027-2025)。这三项团体标准不仅是共达电声在汽车电子电器领域先进技术的结晶,也是其在推动行业标准建设方面的最新实践成果。
    的头像 发表于 12-10 11:52 727次阅读
    共达电声牵头起草的<b class='flag-5'>三项</b>团体标准获批发布

    徐工汽车荣获新能源商用车领域三项大奖

    近日,在“2025第一商用车网年度评选”中,徐工汽车包揽“2025年度新能源商用车价值引领品牌”“2025年度第一畅销新能源重卡”及“2025年度第一推荐新能源轻卡”三项行业大奖,展现出在商用车赛道上的强劲势头。
    的头像 发表于 12-02 16:31 1085次阅读

    格科微电子荣膺三项权威认可

    近期,格科获得由政府、媒体与专业机构颁发的三项权威认可,覆盖CMOS图像传感器细分市场竞争力、技术创新成果和质量管理体系建设大方向。
    的头像 发表于 12-01 16:30 638次阅读

    广汽集团荣膺三项权威大奖

    9月25日,由车质网与凯睿赛驰咨询联合主办的2025年中国汽车产品质量表现研究(AQR)结果发布暨颁奖典礼在北京举行。广汽集团凭借卓越的产品品质与质量管理水平,一举斩获三项大奖。
    的头像 发表于 09-30 13:47 1201次阅读

    惠州亿纬动力连续获得三项资质认证

    近期,惠州亿纬动力电池有限公司(以下简称:惠州亿纬动力)成功获批首批工业和信息化部重点培育中试平台、广东省工程研究中心、广东省先进级智能工厂三项资质,彰显了企业在技术创新、智能制造及产业协同中的扎实能力和显著成果。
    的头像 发表于 09-19 11:51 1057次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    主要步骤: ①溯因②假说③实验 1、科学推理的类型 ①演绎②归纳 2、自动化科学发现框架 AI-笛卡儿-----自动化科学发现框架,利用数据和知识来生成和评估候选的科学假说。 4规则:、直觉
    发表于 09-17 11:45

    AI 芯片浪潮下,职场晋升新契机?

    芯片设计为例,从最初的架构选型,到算法适配、性能优化,每个环节都考验着工程师的专业素养。在设计一款面向智能安防领域AI 芯片时,需要深入研究安防场景下图像识别算法的特点,针对性地
    发表于 08-19 08:58

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的科学
    的头像 发表于 08-05 16:30 1332次阅读

    理想汽车荣膺三项年度大奖

    荣膺三项年度大奖:理想MEGA和理想L6均获得C-AHI中国汽车健康指数推荐车型,理想L6获得IVISTA中国智能汽车指数推荐车型。
    的头像 发表于 07-15 17:13 1019次阅读

    华宝新能斩获三项2025德国iF设计奖

    仓(Jackery Power Bank & Charging Station),以及在研产品 Jackery Solar Gazebo 2000,一举斩获三项iF产品设计奖。
    的头像 发表于 06-25 15:38 936次阅读

    标准引领,赋能健康中国|喜报!回映电子参与起草的三项脑机接口临床医疗器械团体标准正式发布

    喜报在脑科学与人工智能深度融合、国家“健康中国2030”战略持续推进的时代浪潮中,我国神经调控领域标准化建设迎来重大突破。由深圳回映电子科技有限公司作为核心起草单位之一参与制定的三项脑机接口相关神经
    的头像 发表于 05-13 19:49 1218次阅读
    标准引领,赋能健康中国|喜报!回映电子参与起草的<b class='flag-5'>三项</b>脑机接口临床医疗器械团体标准正式发布

    Future AIHER公司提交三项AI混增系统专利申请

    ,其新近成立的子公司 Future AIHER 已正式提交三项专利申请,旨在确立FF在智能电动动力系统创新的领先地位。
    的头像 发表于 05-12 10:18 1019次阅读