0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CVPR 2023最佳论文候选!真实高精3D物体数据集OmniObject3D

CVer 来源:CVer 2023-06-19 15:30 次阅读

导读

为了促进真实世界中感知、重建和生成领域的发展,我们提出了 OmniObject3D,一个高质量的大类别真实三维物体数据集。本数据集有三个主要优势:1)类别丰富:覆盖 200 余个类别的约 6K 个三维物体数据;2)标注丰富:包括了高精表面网格、点云、多视角渲染图像,和实景采集的视频;3)真实扫描:专业的扫描设备保证了物体数据的精细形状和真实纹理。

OmniObject3D 是目前学界最大的真实世界三维扫描模型数据集,为未来的三维视觉研究提供了广阔的空间。利用该数据集,我们探讨了点云识别、神经渲染、表面重建、三维生成等多种学术任务的鲁棒性和泛化性,提出了很多有价值的发现,并验证了其从感知、重建、到生成领域的开放应用前景。我们希望 OmniObject3D 以及其对应的 benchmarks 能够为学术研究和工业应用带来新的挑战和机会。作为 CVPR 2023 的投稿,我们收到了 4 位审稿人的一致满分评价,并获推CVPR Award Candidate(top 12 / 9155)。

论文名称:

OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation

6a16fc12-0e72-11ee-962d-dac502259ad0.png

背景介绍

面向真实 3D 物体的感知、理解、重建与生成是计算机视觉领域一直倍受关注的问题,也在近年来取得了飞速的进展。然而,由于社区中长期缺乏大规模的实采 3D 物体数据库,大部分技术方法仍依赖于 ShapeNet[1] 等仿真数据集。再者,仿真数据与真实数据之间的外观和分布差距巨大,这大大限制了它们在现实生活中的应用。

为了解决这一困难,近年来也有一些优秀的工作如 CO3D[2] 等从视频/多视角图片中寻求突破点,并利用 SfM 的方式重建 3D 点云,然而这种方式得到的点云往往难以提供完整、干净、精准的 3D 表面和纹理。因此,社区迫切需要一个大规模且高质量的真实世界 3D 物体扫描数据集,这将有助于推进许多3D视觉任务和下游应用。

6a4c36fc-0e72-11ee-962d-dac502259ad0.png

仿真数据与真实扫描数据的对比:仿真数据的纹理和几何往往比较简单且失真。

6a597a24-0e72-11ee-962d-dac502259ad0.jpg

多视角图片重建点云与真实扫描数据的对比。重建点云往往含有噪声,且无法恢复精细的表面与纹理,在没有拍摄到的位置存在大面积空洞。

数据集特点

OmniObject3D 为每一个物体提供了四种模态信息,包括:带纹理的高精模型、点云、多视角渲染图像、实景拍摄的环绕视频。对于每个拍摄的视频,我们平均抽取了 200 帧,并提供前景掩码和 SfM 重建的相机位姿和稀疏点云。

6a775f62-0e72-11ee-962d-dac502259ad0.jpg

6a80d66e-0e72-11ee-962d-dac502259ad0.jpg

模态示例

文件层级

数据集的整体类别内物体数量呈长尾分布,与 ImageNet[3]、COCO[4]、LVIS[5] 和 ShapeNet[1] 等热门 2D 及 3D 数据集中的常见类别有高度共享。

6a8c06ce-0e72-11ee-962d-dac502259ad0.png

每个类别内物体数量分布图

下游应用

OmniObject3D 为学界带来了广泛的探索空间,在本文中,我们选取了四个下游任务进行评估与分析。

任务一:

点云分类鲁棒性(Point Cloud Classification Robustness)

物体点云分类是 3D 感知中最基本的任务之一。在本节中,我们展示了 OmniObject3D 如何通过解耦 out-of-distribution styles & out-of-distribution corruptions 来实现更全面的点云分类的鲁棒性分析。

6abce62c-0e72-11ee-962d-dac502259ad0.png

OmniObject3D 提供了一个干净的真实世界物体点云数据集,使得能够针对 OOD styles & OOD corruptions 的鲁棒性进行细粒度分析。

具体来说,1)CAD 模型与真实扫描模型之间的差异引入了 OOD styles;2)常见点云破坏因子产生了 OOD corruptions。

在之前的研究工作中,含噪的真实物体数据集如 ScanObjectNN[6] 将两种情况藕合起来,无法实现解耦分析;主动加入破坏因子的仿真数据集如 ModelNet-C[7] 则仅仅反映了第二种情况。OmniObject3D 则具备将两种情况解耦分析的要素。

我们对十种最常见的点云分类模型进行了测试,并揭示了其与 ModelNet-C 数据集中结论的异同。在应对这两个挑战时,如何实现一个真正鲁棒的点云感知模型仍需更加深度的探索。

6ac939e0-0e72-11ee-962d-dac502259ad0.png

点云分类鲁棒性实验结果

6ab253c4-0e72-11ee-962d-dac502259ad0.gif

任务二:

新视角合成(Novel View Synthesis)

自 NeRF[8] 提出以来,新视角合成一直是领域内的一个热门方向。

我们在 OmniObject3D 上研究了两种赛道下的新视角合成方法:

1)利用密集视角图片输入,对单一场景进行优化训练;

2)挖掘数据集中不同场景之间的先验,探索类 NeRF 模型的泛化能力。

首先,对于单场景优化的模型,我们观察到基于体素的方法会更加擅长建模高频纹理信息,而基于隐式模型的方法则相对更能抵抗表面凹陷或弱纹理等容易产生几何歧义的情况。

数据集中物体多变而复杂的形状和外观为这项任务提供了一个全新的评估基准。

6adb5e54-0e72-11ee-962d-dac502259ad0.png

多个常见方法的单场景优化效果示例

相对于拟合的单个场景的模型,跨场景可泛化框架在本数据集上的表现则更令人期待。网络从很多同类别、甚至跨类别的数据中学习到可以泛化的信息,即可对于一个全新场景的稀疏视角输入做出新视角预测。

实验表明,作为一个几何和纹理信息丰富的数据集,OmniObject3D 有助于促使模型学到对新物体或甚至新类别的泛化能力。

6ae87bd4-0e72-11ee-962d-dac502259ad0.gif

泛化性模型效果示例

6ab253c4-0e72-11ee-962d-dac502259ad0.gif

任务三:

表面重建(Surface Reconstruction)

除了新视角合成外,如果能恢复物体的显式表面,将更加有助于下游应用的开发。同时,我们的数据具备精准且完整的三维表面,能够充分支持表面重建精度的评测需要。

类似的,我们也为表面重建任务设置了两条赛道:

1)稠密视角采样下的表面重建;

2)稀疏视角采样下的表面重建。

稠密视角下表面重建结果展示了数据集内几何形状的显著多样性。精准的扫描使得我们能够使用 Chamfer Distance 作为重建精度的度量。将类别划分为三个“难度”等级,可以观察到所有方法在不同等级上的结果存在明显的差距。

与仅包含 15 个场景的标准 DTU[9] 基准相比,我们的数据集在这项任务上提供了更全面的评估结果。

6afc51ea-0e72-11ee-962d-dac502259ad0.gif

6b1945fc-0e72-11ee-962d-dac502259ad0.gif

6b2ee614-0e72-11ee-962d-dac502259ad0.gif

稠密视角表面重建示例

稀疏视图表面重建是一个更具挑战性的任务,在所有方法的结果中我们都观察到了明显瑕疵,均未达到能够满足实际应用的水平。

除了专为稀疏视角表面重建设计的方法外,我们还评估了前面提到的泛化性新视角合成模型的几何恢复能力——数据集提供的精准 3D Ground Truth 在评测中再次发挥了优势,然而他们的表现同样无法令人满意。

综上所述,这个问题的探索空间仍然巨大,而 OmniObject3D 为该领域进一步的研究提供了扎实的数据基础。

6b90f908-0e72-11ee-962d-dac502259ad0.png

稠密和稀疏视角表面重建效果示例

6ab253c4-0e72-11ee-962d-dac502259ad0.gif

任务四:

3D 物体生成(3D Object Generation)

除了重建之外,OmniObject3D 还可以用来训练真实 3D 物体的生成模型。我们采用 GET3D[10] 框架同时生成形状和纹理,并尝试使用单个模型从数据集中同时学习多种类别的生成。

6ba5f33a-0e72-11ee-962d-dac502259ad0.png

带纹理的 3D 物体生成

通过在隐空间插值,可以观察到生成模型跨类别变化的特性。我们在文章中还着重探讨了由于训练数据不平衡导致的生成语义分布失衡特点,详细请参考论文。

6baeb6c8-0e72-11ee-962d-dac502259ad0.png

形状和纹理低维隐码插值结果

未来工作

关于数据集本身,我们会致力于不断扩大和更新数据集以满足更广泛的研究需求。除了现有的应用,我们还计划进一步发展其他下游任务,如 2D / 3D 物体检测和 6D 姿态估计等。除了感知和重建任务外,在 AIGC 时代,我们相信 OmniObject3D 能够在推动真实感 3D 生成方面发挥至关重要的作用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2910

    浏览量

    107890
  • 数据集
    +关注

    关注

    4

    文章

    1209

    浏览量

    24803
  • AIGC
    +关注

    关注

    1

    文章

    367

    浏览量

    1596

原文标题:CVPR 2023最佳论文候选!真实高精3D物体数据集OmniObject3D

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    下一站创新:3D显示屏、3D物体识别技术?

    “视网膜”之后会出现什么样的显示屏呢?可能是可弯折显示屏,也可能是3D显示屏。比起指纹识别,似乎3D物体识别听起来会更酷一些。最近,在网上就曝光了亚马逊将配备于自家智能手机的3D
    发表于 10-23 09:26 1388次阅读

    基于深度学习的方法在处理3D点云进行缺陷分类应用

    背景部分介绍了3D点云应用领域中公开可访问的数据的重要性,这些数据对于分析和比较各种模型至关重要。研究人员专门设计了各种
    的头像 发表于 02-22 16:16 1314次阅读
    基于深度学习的方法在处理<b class='flag-5'>3D</b>点云进行缺陷分类应用

    3D扫描的结构光

    耐用性。由于尺寸、冷却和电池要求,系统设计将光通量和能效视为重中之重。 目前有很多对3D结构光图形进行优化的技术。其中一个特别有效的方法就是自适应图形。算法确定了图形与波长的最佳组合,以提高被扫描
    发表于 08-30 14:51

    浩辰3D的「3D打印」你会用吗?3D打印教程

    设计。由浩辰CAD公司研发的浩辰3D作为从产品设计到制造全流程的高端3D设计软件,不仅能够提供完备的2D+3D一体化解决方案,还能一站式集成3D打印的多元化
    发表于 05-27 19:05

    基于3D打印的原理及应用

    3D打印原理:分层打印(2D)与层叠堆砌(3D), 3D打印(3DP)即快速成型技术的一种,它是一种以数字模型文件为基础,运用粉末状金属或塑
    发表于 09-23 10:19 20次下载

    自动驾驶的核心基础在3D地图

    要想自动驾驶落地应用,赶紧搞高清3D地图吧,目前,全球科技巨头早已默默布局这一领域,同时众多创企也在对3D地图技术发力。
    发表于 02-25 22:17 1540次阅读
    自动驾驶的核心基础在<b class='flag-5'>高</b><b class='flag-5'>精</b><b class='flag-5'>3D</b>地图

    探讨3D地图对无人驾驶汽车的重要性

    3D地图对无人驾驶汽车至关重要,不仅提供位置信息,还承担安全功能,但目前该行业呈碎片化,面临数据收集和缺乏标准的问题。
    的头像 发表于 08-14 09:54 4760次阅读

    3D技术在全方位汽车立体监视系统中应用

    3D基于人对空间和物体的认知,是有深度、全视角的。3D可使人们获得更直观和互动的体验。生成3D图像需要复杂尖的图像显示控制器(Graphi
    的头像 发表于 11-01 07:55 2166次阅读

    地图之3D栅格地图的应用

    什么是3D栅格地图
    的头像 发表于 07-24 10:58 8307次阅读

    谷歌AI发布3D物体数据,附带标记边界框、相机位姿、稀疏点云

    见过3D物体数据,见过会动的3D物体数据
    的头像 发表于 11-13 14:28 2304次阅读

    NVIDIA 3D MoMa:基于2D图像创建3D物体

    可逆渲染流程 NVIDIA 3D MoMa 将于本周在新奥尔良举行的计算机视觉和模式识别会议 CVPR 上亮相。
    的头像 发表于 06-23 11:00 1332次阅读

    3D点云数据3D数字化技术中的应用

    随着计算机视觉技术的不断发展,3D 数字化技术已经成为了当今工业制造领域和三维医学影像领域的关键技术。然而,构建高精度、高分辨率的 3D 点云数据对于实现这一技术至关重要。在这篇文章
    的头像 发表于 05-06 16:46 1509次阅读

    3D形状分析利器】3D扫描应用案例分享

    3D数据集成度测量头,包含高低倍镜头,软件一键切换可与3D-CAD对比,实现形变的可视化,失效分析等【主要应用方向:】3D对比:对比产品与
    的头像 发表于 02-01 11:50 1175次阅读
    【<b class='flag-5'>3D</b>形状分析利器】<b class='flag-5'>3D</b>扫描应用案例<b class='flag-5'>集</b>分享

    创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

    一篇最佳论文,一篇最佳论文候选,共计54篇论文被接收 ,商汤科技及联合实验室交出
    的头像 发表于 06-22 06:15 491次阅读
    创造历史!商汤联合团队斩获<b class='flag-5'>CVPR</b><b class='flag-5'>最佳</b><b class='flag-5'>论文</b>,推出首个“感知决策一体化”自动驾驶通用大模型

    Nullmax提出多相机3D目标检测新方法QAF2D

    今天上午,计算机视觉领域顶会CVPR公布了最终的论文接收结果,Nullmax感知部门的3D目标检测研究《Enhancing 3D Object Detection with 2
    的头像 发表于 02-27 16:38 1196次阅读
    Nullmax提出多相机<b class='flag-5'>3D</b>目标检测新方法QAF2<b class='flag-5'>D</b>