0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三维实体检测解决方案

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-01-19 14:45 次阅读

仅仅通过在照片上训练模型,机器学习(ML)的最新技术就已经在许多计算机视觉任务中取得了卓越的准确性。在这些成功的基础上,进一步提高对3D对象的理解,这将极大地促进更广泛的应用,例如增强现实,机器人技术,自主性和图像检索。

今年早些时候,我们发布了MediaPipe Objectron,这是一套针对移动设备设计的实时3D对象检测模型,这些模型在经过完全注释(annotated)的真实3D数据集上进行了训练,可以预测对象的3D边界框。

然而,由于与2D任务(例如ImageNet,COCO和Open Images)相比,因为缺少大型真实数据集,所以了解3D对象仍然是一项具有挑战性的任务。为了使研究社区能够不断提高三维实体的理解,迫切需要发布以对象为中心视频数据集,该数据集可以捕获对象的更多3D结构,同时匹配用于许多视觉任务的数据格式(例如视频或摄像机流),以帮助训练和确定机器学习模型的基准。

今天,我们很高兴发布Objectron数据集,这是一个短的,以对象为中心的视频剪辑的集合,可以从不同的角度捕获更大的一组公共对象。每个视频剪辑都随附有AR会话元数据,其中包括相机姿势和稀疏点云。除此之外,数据还包含每个对象手工标注的3D边框,用来描述对象的位置,方向和尺寸。数据集包括15K带注释的视频剪辑,并补充了从不同地理区域的样本中收集的超过4M带注释的图像(覆盖五大洲的10个国家/地区)。

三维实体检测解决方案

除了和数据集一起之外,我们还将共享一个针对四类对象的三维实体检测解决方案-鞋子,椅子,杯子和照相机。这些模型在MediaPipe中发布,MediaPipe是Google的跨平台可定制ML解决方案的开源框架,适用于实时和流媒体,该解决方案还支持设备上的实时手部,虹膜和身体姿势跟踪等ML解决方案。

在移动设备上运行的3D对象检测解决方案的示例结果

与以前发布的单阶段Objectron模型相反,这些最新版本使用两级架构。第一阶段采用TensorFlow对象检测模型来查找实体的2D裁剪。然后,第二阶段使用图像裁剪来估计3D边框,同时为下一帧计算实体的2D裁剪,因此实体检测器不需要运行每个帧。第二阶段3D边框预测器在Adreno 650移动GPU上以83 FPS运行。

a52aa03c-4ec2-11eb-8b86-12bb97331649.png

参考3D对象检测解决方案图

3D对象检测的评估指标

借助ground truth annotations,我们使用3Dintersection over union(IoU)相似度统计信息(一种用于计算机视觉任务的常用度量标准)来评估三维实体检测模型的性能,该度量标准衡量边框与地面真相的接近程度。

我们提出了一种算法,可为通用三维面向盒计算准确的3D IoU值。首先,我们使用Sutherland-Hodgman多边形裁剪算法计算两个盒子的面之间的交点。这类似于用于计算机图形学的视锥剔除技术。相交的体积由所有修剪的多边形的凸包计算。最后,根据两个框的交点的体积和并集的体积计算IoU。我们将在发表数据集的同时发布评估指标的源代码。

使用多边形裁剪算法计算并集的三维交点(左):通过对方框裁剪多边形计算每个面的交点。右:通过计算所有交点的凸包计算交点的体积(绿色)。

数据集格式

数据集的技术细节,包括用法和教程,可在数据集网站上找到。数据集包括自行车,书籍,瓶子,照相机,谷物盒,椅子,杯子,笔记本电脑和鞋子,并存储在Google Cloud存储上的objectron存储桶中,具有以下资源:

视频片段

注释标签(实体的3D边框)

AR元数据(例如照相机姿势,点云和平面)

已处理的数据集:带注释帧的改编版本,图像的格式为tf.example,视频的格式为SequenceExample。

支持脚本以基于上述指标运行评估

支持脚本以将数据加载到Tensorflow,PyTorch和Jax中并可视化数据集,包括“ Hello World”示例

有了数据集,我们还将开放数据管道,以在流行的Tensorflow,PyTorch和Jax框架中解析数据集。还提供了示例colab笔记本。

通过发布此Objectron数据集,我们希望使研究界能够突破三维实体几何理解的极限。我们还希望促进新的研究和应用。例如视图合成,改进的三维表达和无监督学习。加入我们的邮件列表并访问我们的github页面,请随时关注未来的活动和发展。

致谢

这篇文章中描述的研究是由Adel Ahmadyan, Liangkai Zhang, JianingWei, Artsiom Ablavatski, Mogan Shieh, Ryan Hickman, Buck Bourdon, Alexander Kanaukou, Chuo-Ling Chang, Matthias Grundmann, ‎and Tom Funkhouser完成的。我们感谢Aliaksandr Shyrokau,Sviatlana Mialik,Anna Eliseeva和注释团队的高质量注释。我们还要感谢Jonathan Huang和Vivek Rathod对TensorFlow对象检测API的指导。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测器
    +关注

    关注

    1

    文章

    866

    浏览量

    47721
  • Google
    +关注

    关注

    5

    文章

    1766

    浏览量

    57619
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24737

原文标题:Google发布Objectron数据集

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    三维扫描与建模的区别 三维扫描在工业中的应用

    数据。这一过程是自动化的,能够快速捕捉物体的三维信息。 三维建模 :则需要专业建模师使用三维建模软件,从无到有地创建三维模型。建模师可以根据不同的需求调整建模
    的头像 发表于 12-19 14:55 205次阅读

    南方智能推出三维地理实体生产软件

    新型基础测绘与实景三维中国建设持续推进,南方智能深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景三维系列软件,提供全流程、按需定制的服务
    的头像 发表于 11-06 10:26 223次阅读

    三维打印技术原理

    三维打印技术,又称3D打印技术,是一种快速成型技术,其核心原理在于将数字模型文件逐层转化为实体物体。以下是三维打印技术原理的详细阐述:
    的头像 发表于 09-16 15:31 764次阅读

    蔡司扫描仪GOM Scan 1三维扫描仪对考古文物建模扫描

    在考古环境中,三维扫描技术应用广泛,如存档、保存、复制和分享(包括实体和虚拟形式)。文中,通过真实的扫描案例,您将了解到三维光学解决方案如何帮助呈现精确细节、显示文物颜色和纹理的扫描网
    的头像 发表于 09-04 10:51 576次阅读
    蔡司扫描仪GOM Scan 1<b class='flag-5'>三维</b>扫描仪对考古文物建模扫描

    友思特方案 基于三维点云实现PCB装配螺丝视觉检测

    三维点云是完成精密化 PCB 检测的最新视觉技术。友思特 Saccde Vision 视觉扫描系统,采用先进的三维成像技术和算法输出直观点云图,进一步确保了PCB生产的可靠性与稳定性能。
    的头像 发表于 08-28 16:35 314次阅读
    友思特<b class='flag-5'>方案</b>  基于<b class='flag-5'>三维</b>点云实现PCB装配螺丝视觉<b class='flag-5'>检测</b>

    校园三维可视化解决方案

    在当今数字化时代,校园管理面临着越来越复杂的挑战和需求。为了更好地实现校园资源管理、安全监控、规划设计等多方面的需求,校园 三维可视化 解决方案应运而生。通过将校园环境、设施、资源等信息进行
    的头像 发表于 08-16 14:05 201次阅读

    泰来三维|三维激光扫描技术在古建筑保护中的应用

    通过三维激光扫描技术,可以快速获取古建筑的精确三维模型。在文物保护与修复过程中,利用三维模型可以更加全面、准确地记录古建筑的损伤情况,并辅助修复工作的设计和实施。例如,通过对模型进行测量和分析,修复人员可以预测古建筑的稳定性,制
    的头像 发表于 06-21 09:15 567次阅读
    泰来<b class='flag-5'>三维</b>|<b class='flag-5'>三维</b>激光扫描技术在古建筑保护中的应用

    车架三维扫描逆向建模大尺寸部件stl建模曲面逆向设计方案

    三维扫描技术在汽车设计、制造、质量检测等多个环节中都发挥着关键作用。汽车车架三维扫描建模是汽车工程领域中的一项重要技术,通过CASAIM高精度的三维扫描设备,对车架表面进行快速扫描,获
    的头像 发表于 06-11 16:57 463次阅读
    车架<b class='flag-5'>三维</b>扫描逆向建模大尺寸部件stl建模曲面逆向设计<b class='flag-5'>方案</b>

    泰来三维|数字化工厂_煤矿三维扫描数字化解决方案

    采用大空间三维激光扫描仪对厂区内部进行架站式精准三维扫描。厂区外部采用无人机倾斜摄影的方式获取彩色模型数据,采集控制点坐标与三维点云进行坐标转换融合点云数据,快速得到厂区内外完整的 三维
    的头像 发表于 05-29 11:55 477次阅读
    泰来<b class='flag-5'>三维</b>|数字化工厂_煤矿<b class='flag-5'>三维</b>扫描数字化<b class='flag-5'>解决方案</b>

    三维雷达在煤矿安全检测中如何应用

    三维雷达在煤矿安全检测中的应用主要体现在以下几个方面: 井下环境探测: 三维雷达技术能够扫描煤矿井下环境,生成高精度的三维点云数据,从而构建出井下的
    的头像 发表于 05-22 10:08 448次阅读
    <b class='flag-5'>三维</b>雷达在煤矿安全<b class='flag-5'>检测</b>中如何应用

    三维雷达在煤堆检测中的具体应用和优势

    三维雷达在煤堆检测中具有显著的优势和应用价值。以下是三维雷达在煤堆检测中的具体应用和优势: 原理介绍: 三维雷达通过发射高频电磁波,这些电磁
    的头像 发表于 05-22 10:05 375次阅读
    <b class='flag-5'>三维</b>雷达在煤堆<b class='flag-5'>检测</b>中的具体应用和优势

    泰来三维|三维扫描服务_三维扫描助力园区改造公园

    三维激光扫描仪利用激光反射测距原理,通过接受和返回的信号,获取点云三维空间坐标。这种测量方式可以无接触快速获取大型建筑三维空间数据,实现实体建筑的高精度数字化。 根据
    的头像 发表于 05-07 11:44 290次阅读
    泰来<b class='flag-5'>三维</b>|<b class='flag-5'>三维</b>扫描服务_<b class='flag-5'>三维</b>扫描助力园区改造公园

    三维扫描服务项目-工厂三维扫描建模

    工厂三维扫描,厂房三维扫描,工厂数字化服务,工厂三维扫描解决方案,逆向还原石化管线,完成工厂数据化,为工厂设施的设计改造和维修维护提供原始三维
    的头像 发表于 04-26 09:46 575次阅读
    <b class='flag-5'>三维</b>扫描服务项目-工厂<b class='flag-5'>三维</b>扫描建模

    泰来三维|文物三维扫描,文物三维模型怎样制作

    文物三维扫描,文物三维模型怎样制作:我们都知道文物是不可再生的,要继续保存传承,需要文物三维数字化保护,所以三维数字化文物保护是非常重要的一个技术手段。 那么文物
    的头像 发表于 03-12 11:10 651次阅读
    泰来<b class='flag-5'>三维</b>|文物<b class='flag-5'>三维</b>扫描,文物<b class='flag-5'>三维</b>模型怎样制作

    泰来三维| 高精度工业3D扫描助力模具检测和逆向设计“数字化”发展

    工业3D扫描系列包括手持式激光三维扫描仪、跟踪式激光三维扫描系统、固定式蓝光三维扫描仪, FreeScan UE Pro、FreeScan Trak Pro,为各类模具检测应用提供适配
    的头像 发表于 01-29 16:22 502次阅读
    泰来<b class='flag-5'>三维</b>| 高精度工业3D扫描助力模具<b class='flag-5'>检测</b>和逆向设计“数字化”发展