0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

3D视觉工坊 来源:凹非寺 2023-04-10 11:12 次阅读

普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。

水杯来回动的动态场景下,细节清晰可见:

38654f44-d72b-11ed-bfe3-dac502259ad0.gif

静态场景效果也同样nice,狗狗突出的肋骨都被还原了出来:

38743edc-d72b-11ed-bfe3-dac502259ad0.gif

对比来看其他方法,效果是酱婶的……

388fbc84-d72b-11ed-bfe3-dac502259ad0.png

这就是英伟达最新提出的方法BundleSDF。

这是一种可对未知物体的6D姿态追踪和三维重建的方法。

用于从单目RGBD视频序列中跟踪未知物体的6自由度运动,同时进行物体的隐式神经三维重建,方法接近于实时(10Hz)。

这种方法适用于任意刚性物体,即使视觉纹理大部分确实,仅需在第一帧中分割出物体,不需要任何额外的信息,并且不对智能体与物体的交互模式做任何假设。

目前,该方法已被CVPR 2023接收。

可处理大幅度姿态变化、有遮挡视频

该方法的关键是一个神经物体场,它与姿态图优化过程同时进行,以便将信息稳健地累积到一致的3D表示中,捕捉几何和外观。

方法自动维护了一组动态的姿态内存帧,以便这些线程之间进行通信

它能处理具有大幅度姿态变化、部分和完全遮挡、无纹理表面和高光反射等具有挑战性的视频。

作者展示了HO3D、YCBInEOAT和BEHAVE数据集上的结果,证明了我们的方法显著优于现有方法。

野外测试

用于iPhone 12 Pro Max的效果:

38a7c02c-d72b-11ed-bfe3-dac502259ad0.gif

用于Intel RealSense的效果:

38dd70a0-d72b-11ed-bfe3-dac502259ad0.gif

该方法不仅适用于更具挑战性的动态场景,还适用于此前经常被考虑的静态场景(移动相机)。

因此实现了比专门设计用于静态场景的那些方法更好或相当的结果(即文章开头展示动图)。

391d3c6c-d72b-11ed-bfe3-dac502259ad0.png

与SOTA对比

HO3D数据集上三种最具竞争力方法的定性比较。

左图:6自由度姿态跟踪可视化,其中轮廓(青色)以估计的姿态渲染。

值得注意的是,如第二列所示,我们的预测姿态有时甚至会纠正GT的错误。

右图:每种方法输出的最终3D重建的正面和背面视图。

由于手部遮挡,视频中的某些部分永远不可见。虽然从相同的视角渲染网格,但是DROID-SLAM和BundleTrack的显著漂移导致网格错误旋转。

3924d4f4-d72b-11ed-bfe3-dac502259ad0.png

定量结果对比如下:

3943413c-d72b-11ed-bfe3-dac502259ad0.png

394be404-d72b-11ed-bfe3-dac502259ad0.png

3952cb34-d72b-11ed-bfe3-dac502259ad0.png

问题设置

给定一段单目RGBD输入视频以及仅在第一帧中目标物体的分割掩码,该方法能持续追踪物体的6-DoF姿态并重建物体的3D模型。

所有处理都是在线自回归的(没有假设未来帧可用)。

处理的物体是刚性的,但不依赖其特定丰富的纹理 - 方法适用于无纹理的物体。

此外,不需要物体的实例级CAD模型,也不需要物体类别的先验知识(例如事先对同一物体类别进行预训练)。

具体框架

395af3d6-d72b-11ed-bfe3-dac502259ad0.png

首先,在连续的分割图像之间匹配特征,以获得粗略的姿态估计(第3.1节)。

其中一些带姿态的帧被存储在内存池中,以便稍后使用和精化(第3.2节)。

从内存池的子集动态创建位姿图(第3.3节);在线优化与当前姿态一起联合细化图中的所有姿态。

然后,这些更新的姿态被存储回内存池中。

最后,内存池中的所有带姿态的帧用于学习神经物体场(在单独的线程中),该场建模了物体的几何和视觉纹理(第3.4节),同时调整其先前估计的姿态,使姿态跟踪更加鲁棒。

项目地址:
https://bundlesdf.github.io/

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2848

    浏览量

    107242
  • 三维重建
    +关注

    关注

    0

    文章

    25

    浏览量

    9890
  • 姿态
    +关注

    关注

    0

    文章

    3

    浏览量

    7878

原文标题:英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    三维打印技术原理

    三维打印技术,又称3D打印技术,是一种快速成型技术,其核心原理在于将数字模型文件逐层转化为实体物体。以下是三维打印技术原理的详细阐述:
    的头像 发表于 09-16 15:31 378次阅读

    留形科技借助NVIDIA平台提供高效精确的三维重建解决方案

    本案例中,留形科技借助 NVIDIA Jetson 和 Omniverse 平台,实现边缘设备上的实时、全彩、无损三维重建,从而在建筑细节捕捉、大型基础设施的数字孪生等应用中,大幅提升三维数据采集与处理的效率与精度。
    的头像 发表于 09-09 09:42 366次阅读

    基于大模型的仿真系统研究一——三维重建大模型

    问题,赛目推出了基于大模型的仿真系统,利用机器学习、深度学习等人工智能技术,不仅推出自动标注大模型、多模态检测大模型和场景生成大模型等模块,并且引入三维重建大模型加强渲染画面真实性。    通过上述模块,赛目的路采
    的头像 发表于 07-30 14:51 1277次阅读
    基于大模型的仿真系统研究一——<b class='flag-5'>三维重建</b>大模型

    泰来三维 工厂三维扫描建模技术服务

    通过利用三维扫描技术建立工厂物体三维模型,可以更加直观地了解物体的形状和尺寸信息,避免传统测量方法的误差和繁琐操作,从而提高生产效率和质量
    的头像 发表于 07-22 13:14 262次阅读
    泰来<b class='flag-5'>三维</b> 工厂<b class='flag-5'>三维</b>扫描建模技术服务

    三维扫描与3D打印在法医头骨重建中的突破性应用

    随着科技的飞速发展,三维扫描和3D打印技术已经逐渐渗透到医疗领域的各个环节,为临床诊断、治疗和医学研究带来了前所未有的便利。特别是在法医学领域,三维扫描和3D打印技术的应用更是为头骨
    的头像 发表于 04-19 10:26 402次阅读
    <b class='flag-5'>三维</b>扫描与3<b class='flag-5'>D</b>打印在法医头骨<b class='flag-5'>重建</b>中的突破性应用

    常用的RGB-D SLAM解决方案

    BundleFusion是一种稠密的实时室内场景三维重建算法框架。输入为RGB-D相机采集的并且是对齐好的RGB图像和深度图的数据流。输出为重建好的稠密三维场景模型。
    的头像 发表于 04-16 09:37 814次阅读
    常用的RGB-<b class='flag-5'>D</b> SLAM解决方案

    Nullmax提出多相机3D目标检测新方法QAF2D

    今天上午,计算机视觉领域顶会CVPR公布了最终的论文接收结果,Nullmax感知部门的3D目标检测研究《Enhancing 3D Object Detection with 2D De
    的头像 发表于 02-27 16:38 1040次阅读
    Nullmax提出多相机3<b class='flag-5'>D</b>目标检测<b class='flag-5'>新方法</b>QAF2<b class='flag-5'>D</b>

    角矿山机械设备三维扫描、逆向3d建模抄数设计

    在机械制造领域,逆向工程很多企业经常使用的一种方法,逆向工程可以帮助企业复制、改进和优化产品。CASAIM中科广电主要使用三维扫描技术来获取产品表面的三维数据,三维测量技术能够快速、高
    的头像 发表于 01-16 15:14 424次阅读
    珠<b class='flag-5'>三</b>角矿山机械设备<b class='flag-5'>三维</b>扫描、逆向3<b class='flag-5'>d</b>建模抄数设计

    工业上常见的高精度主动式重建算法

    三维重建目前是最为炙手可热的领域。摄影测量或结构光投影技术可以解决漫反射重建问题,但却无法有效应对镜面反射物体(如玻璃、积水、反光物体和汽车车身)等的
    发表于 01-05 10:46 417次阅读
    工业上常见的高精度主动式<b class='flag-5'>重建</b>算法

    基于光学计算超表面的全光学目标识别和三维重建技术

    随着物体识别和三维(3D) 重建技术在各种逆向工程、人工智能、医疗诊断和工业生产领域变得必不可少,人们越来越关注与寻求可以简化处理的高效、更快的速度和更集成的
    的头像 发表于 12-22 10:13 544次阅读
    基于光学计算超表面的全光学目标识别和<b class='flag-5'>三维重建</b>技术

    一个用于6D姿态估计和跟踪的统一基础模型

    今天笔者将为大家分享NVIDIA的最新开源方案FoundationPose,是一个用于 6D 姿态估计和跟踪的统一基础模型。只要给出CAD模型或少量参考图像,FoundationPose就可以在测试时立即应用于新物体,无需任何微
    的头像 发表于 12-19 09:58 772次阅读
    一个用于<b class='flag-5'>6D</b><b class='flag-5'>姿态</b>估计和跟踪的统一基础模型

    3D-IC 设计之早期三维布图综合以及层次化设计方法

    3D-IC 设计之早期三维布图综合以及层次化设计方法
    的头像 发表于 12-04 16:53 478次阅读
    3<b class='flag-5'>D</b>-IC 设计之早期<b class='flag-5'>三维</b>布图综合以及层次化设计<b class='flag-5'>方法</b>

    基于深度学习的三维重建技术

    多视图立体几何(Multi-View Stereo,MVS)是计算机视觉中重要的研究领域,也是迈入三维计算机视觉研究的重点问题。它通过利用多张互相重叠的图像恢复出原始三维场景的几何结构和纹理信息,是现实中拍摄照片的逆过程。
    的头像 发表于 12-04 10:08 845次阅读
    基于深度学习的<b class='flag-5'>三维重建</b>技术

    VLSI系统设计的最新方法

    电子发烧友网站提供《VLSI系统设计的最新方法.pdf》资料免费下载
    发表于 11-20 11:10 0次下载
    VLSI系统设计的最<b class='flag-5'>新方法</b>

    RayDF:实时渲染!基于射线的三维重建新方法

    在机器视觉和机器人领域的许多前沿应用中,学习准确且高效的三维形状表达是十分重要的。然而,现有的基于三维坐标的隐式表达在表示三维形状或是渲染二图像时,需要耗费昂贵的计算成本;
    的头像 发表于 11-17 16:23 670次阅读
    RayDF:实时渲染!基于射线的<b class='flag-5'>三维重建</b><b class='flag-5'>新方法</b>