0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Objectron数据集:3D目标检测数据集及检测方案

新机器视觉 来源:新机器视觉 作者:新智元 2020-11-27 09:49 次阅读

谷歌人工智能实验室近日发布 Objectron 数据集,这是一个以3D目标为中心视频剪辑的集合,这些视频剪辑从不同角度捕获了较大的一组公共对象。数据集包括 15K 带注释的视频剪辑,并补充了从地理多样的样本中收集的超过 4M 带注释的图像(覆盖五大洲的 10 个国家)。

机器学习(ML)的最新技术已经在许多计算机视觉任务上取得了SOTA的结果,但仅仅是通过在2D照片上训练模型而已。 在这些成功的基础上,提高模型对 3D 物体的理解力有很大的潜力来支持更广泛的应用场景,如增强现实、机器人、自动化和图像检索。 今年早些时候,谷歌发布了 MediaPipe Objectron,一套为移动设备设计的实时 3D 目标检测模型,这个模型是基于一个已标注的、真实世界的 3D 数据集,可以预测物体的 3D 边界。

然而,理解3D 中的对象仍然是一项具有挑战性的任务,因为与2D 任务(例如,ImageNet、 COCO 和 Open Images)相比,缺乏大型的真实世界数据集。 为了使研究团体能够继续推进3D 对象理解,迫切需要发布以对象为中心的视频数据集,这些数据集能够捕获更多的对象的3D 结构,同时匹配用于许多视觉任务(例如,视频或摄像机流)的数据格式,以帮助机器学习模型的训练和基准测试。 近期谷歌发布了 Objectron 数据集,这是一个以对象为中心的短视频剪辑数据集,从不同的角度捕捉了一组更大的普通对象。

每个视频剪辑都伴随着 AR 会话元数据,其中包括摄像机姿态和稀疏点云。数据还包含为每个对象手动注释的3D 边界,这些 bounding box 描述了对象的位置、方向和尺寸。 每个视频剪辑都随附有 AR 的元数据,其中包括相机姿势和稀疏点云。数据还包含每个对象的手动注释的 3D 边界框,用于描述对象的位置,方向和尺寸。 该数据集包括15K 注释视频剪辑与超过4M 注释图像收集的地理多样性样本(涵盖10个国家横跨五大洲)。

3D 目标检测解决方案

除了这个数据集,谷歌还分享了一个 3D 目标检测解决方案,可以用于4类物体:鞋子、椅子、杯子和相机。 这些模型是在 MediaPipe 中发布的,MediaPipe 是谷歌的开源框架,用于跨平台可定制的流媒体机器学习解决方案,它同时也支持机器学习解决方案,比如设备上的实时手势、虹膜和身体姿态跟踪。

与之前发布的 single-stage Objectron 模型相比,这些最新版本采用了两级架构。 第一级使用 TensorFlow 目标检测模型来寻找物体的 2D 裁剪,第二级使用图像裁剪来估计三维bounding box,同时计算下一帧对象的二维裁剪,使得目标检测器不需要运行每一帧。第二阶段的三维 bounding box 预测器是以83 FPS在 Adreno 650 GPU 上运行。

3D 目标检测的评估指标

有了真实的注释,我们就可以使用 3D IoU(intersection over union)相似性统计来评估 3D 目标检测模型的性能,这是计算机视觉任务常用的指标,衡量bounding box与ground truth的接近程度。 谷歌提出了一种计算一般的面向三维空间的精确 3D IoU 的算法。 首先使用 Sutherland-Hodgman Polygon clipping 算法计算两个盒子面之间的交点,这类似于计算机图形学的剔除技术(frustum culling),利用所有截断多边形的凸包计算相交的体积。最后,通过交集的体积和两个盒子的并集的体积计算 IoU。 谷歌表示将随数据集一起发布评估的源代码。

数据格式

Objectron 数据集的技术细节,包括使用和教程,均可在数据集网站上获得。这些数据集中的物体包括自行车、书籍、瓶子、相机、麦片盒、椅子、杯子、笔记本电脑和鞋子等,和数据集一起发布的具有以下内容: 1.视频序列 2.带注释的标签(目标的3D 边界框) 3.AR 元数据 (如照相机姿态、点云和平面表面) 4.处理过的数据集: 混合版本的带注释的帧、tf.example 格式的图像和 SequenceExample 格式的视频 5.支持基于上面描述的度量评估的脚本 6.支持脚本将数据加载到 Tensorflow、Pytorch、Jax并且可视化数据集 除了数据集,谷歌还开放了数据管道来解析 Tensorflow、 PyTorch 和 Jax 框架中的数据集。

还提供了 colab notebook 的实例 。 通过发布这个 Objectron 数据集,谷歌希望能够使研究团体推进三维物体几何理解的极限。同时也希望促进新的研究和应用,如视图合成,改进的 3D 表示和非监督式学习等。 参考链接: https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+blogspot%2FgJZg+%28Google+AI+Blog%29

责任编辑:xj

原文标题:重磅!谷歌发布3D目标检测数据集及检测方案

文章出处:【微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2864

    浏览量

    107368
  • 谷歌
    +关注

    关注

    27

    文章

    6143

    浏览量

    105168
  • 人工智能
    +关注

    关注

    1791

    文章

    46932

    浏览量

    237795

原文标题:重磅!谷歌发布3D目标检测数据集及检测方案

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    3D激光线扫轮廓传感器在汽车行业的汽车车缝检测的应用

    在实际应用中,3D激光线扫传感器可以集成到自动化检测系统中,与机器人或自动化输送系统配合,实现对汽车车缝的全面检测。这些系统通常包括传感器、控制软件、数据处理单元和用户界面,能够自动分
    的头像 发表于 09-14 09:00 404次阅读
    <b class='flag-5'>3D</b>激光线扫轮廓传感器在汽车行业的汽车车缝<b class='flag-5'>检测</b>的应用

    广东3D扫描钣金件外观尺寸测量3D偏差检测对比解决方案CASAIM

    3D扫描
    中科院广州电子
    发布于 :2024年07月22日 16:13:45

    3D三维扫描仪的测量数据检测和评估软件

    ZEISSINSPECTOptical3D是蔡司旗下一款强大的三维测量数据检测和评估软件,原名GOMInspect。这款软件在光学测量领域具有广泛的应用,并且已经成为行业标准
    的头像 发表于 07-15 17:20 521次阅读
    <b class='flag-5'>3D</b>三维扫描仪的测量<b class='flag-5'>数据</b><b class='flag-5'>检测</b>和评估软件

    PyTorch如何训练自己的数据

    PyTorch是一个广泛使用的深度学习框架,它以其灵活性、易用性和强大的动态图特性而闻名。在训练深度学习模型时,数据是不可或缺的组成部分。然而,很多时候,我们可能需要使用自己的数据
    的头像 发表于 07-02 14:09 1437次阅读

    苏州吴中区多色PCB板元器件3D视觉检测技术

    3D视觉检测相较于2D视觉检测,有其独特的优势,不受产品表面对比度影响,精确检出产品形状,可以测出高度(厚度)、体积、平整度等。在实际应用中可以与2
    的头像 发表于 06-14 15:02 377次阅读
    苏州吴中区多色PCB板元器件<b class='flag-5'>3D</b>视觉<b class='flag-5'>检测</b>技术

    工业镜头在3D结构光检测中实际应用

    工业镜头在3D结构光检测中实际应用
    的头像 发表于 06-01 08:34 286次阅读
    工业镜头在<b class='flag-5'>3D</b>结构光<b class='flag-5'>检测</b>中实际应用

    请问NanoEdge AI数据该如何构建?

    我想用NanoEdge来识别异常的声音,但我目前没有办法生成模型,我感觉可能是数据的问题,请问我该怎么构建数据?或者生成模型失败还会有哪些原因?
    发表于 05-28 07:27

    大陆团的3D Flash激光雷达有何优势?

    在这一技术革命的前沿,激光雷达成为了不可或缺的一环。而在这其中,大陆团的3D Flash激光雷达引人瞩目。
    发表于 04-11 10:28 341次阅读
    大陆<b class='flag-5'>集</b>团的<b class='flag-5'>3D</b> Flash激光雷达有何优势?

    PLC如何应用于建筑的3D打印?

    MC Pi-Prime模块化PLC采用EtherCat作为通信协议,有助于实现快速的反应时间和精确的定位控制,为自动化工程师提供灵活的扩展与集成,并缩短实施时间,助力建筑行业引入3D打印。
    的头像 发表于 03-22 10:46 327次阅读
    宏<b class='flag-5'>集</b>PLC如何应用于建筑的<b class='flag-5'>3D</b>打印?

    Nullmax提出多相机3D目标检测新方法QAF2D

    今天上午,计算机视觉领域顶会CVPR公布了最终的论文接收结果,Nullmax感知部门的3D目标检测研究《Enhancing 3D Object Detection with 2
    的头像 发表于 02-27 16:38 1093次阅读
    Nullmax提出多相机<b class='flag-5'>3D</b><b class='flag-5'>目标</b><b class='flag-5'>检测</b>新方法QAF2<b class='flag-5'>D</b>

    基于深度学习的方法在处理3D点云进行缺陷分类应用

    背景部分介绍了3D点云应用领域中公开可访问的数据的重要性,这些数据对于分析和比较各种模型至关重要。研究人员专门设计了各种
    的头像 发表于 02-22 16:16 1051次阅读
    基于深度学习的方法在处理<b class='flag-5'>3D</b>点云进行缺陷分类应用

    泰来三维| 高精度工业3D扫描助力模具检测和逆向设计“数字化”发展

    相应的,产品所需的模具结构也变得愈发复杂精密,传统检测方式和测绘工具很难满足些最新需求。高精度工业3D扫描技术的出现,通过获取工件完整的三维数据,为模具检测和逆向设计提供“数字化”破局
    的头像 发表于 01-29 16:22 454次阅读
    泰来三维| 高精度工业<b class='flag-5'>3D</b>扫描助力模具<b class='flag-5'>检测</b>和逆向设计“数字化”发展

    如何搞定自动驾驶3D目标检测

    可用于自动驾驶场景下基于图像的3D目标检测数据总结。其中一些数据
    发表于 01-05 10:43 555次阅读
    如何搞定自动驾驶<b class='flag-5'>3D</b><b class='flag-5'>目标</b><b class='flag-5'>检测</b>!

    4DGen:基于动态3D高斯的可控4D生成新工作

    尽管3D和视频生成取得了飞速的发展,由于缺少高质量的4D数据,4D生成始终面临着巨大的挑战。
    的头像 发表于 01-04 15:57 875次阅读
    4DGen:基于动态<b class='flag-5'>3D</b>高斯的可控4<b class='flag-5'>D</b>生成新工作

    大模型数据:力量的源泉,进步的阶梯

    一、引言 在    的繁荣发展中,大模型数据的作用日益凸显。它们如庞大的知识库,为AI提供了丰富的信息和理解能力。本文将用一种独特的风格来探讨大模型数据的魅力和潜力。 二、大模型
    的头像 发表于 12-07 17:18 652次阅读