0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三维实体检测解决方案

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-01-19 14:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

仅仅通过在照片上训练模型,机器学习(ML)的最新技术就已经在许多计算机视觉任务中取得了卓越的准确性。在这些成功的基础上,进一步提高对3D对象的理解,这将极大地促进更广泛的应用,例如增强现实,机器人技术,自主性和图像检索。

今年早些时候,我们发布了MediaPipe Objectron,这是一套针对移动设备设计的实时3D对象检测模型,这些模型在经过完全注释(annotated)的真实3D数据集上进行了训练,可以预测对象的3D边界框。

然而,由于与2D任务(例如ImageNet,COCO和Open Images)相比,因为缺少大型真实数据集,所以了解3D对象仍然是一项具有挑战性的任务。为了使研究社区能够不断提高三维实体的理解,迫切需要发布以对象为中心的视频数据集,该数据集可以捕获对象的更多3D结构,同时匹配用于许多视觉任务的数据格式(例如视频或摄像机流),以帮助训练和确定机器学习模型的基准。

今天,我们很高兴发布Objectron数据集,这是一个短的,以对象为中心的视频剪辑的集合,可以从不同的角度捕获更大的一组公共对象。每个视频剪辑都随附有AR会话元数据,其中包括相机姿势和稀疏点云。除此之外,数据还包含每个对象手工标注的3D边框,用来描述对象的位置,方向和尺寸。数据集包括15K带注释的视频剪辑,并补充了从不同地理区域的样本中收集的超过4M带注释的图像(覆盖五大洲的10个国家/地区)。

三维实体检测解决方案

除了和数据集一起之外,我们还将共享一个针对四类对象的三维实体检测解决方案-鞋子,椅子,杯子和照相机。这些模型在MediaPipe中发布,MediaPipe是Google的跨平台可定制ML解决方案的开源框架,适用于实时和流媒体,该解决方案还支持设备上的实时手部,虹膜和身体姿势跟踪等ML解决方案。

在移动设备上运行的3D对象检测解决方案的示例结果

与以前发布的单阶段Objectron模型相反,这些最新版本使用两级架构。第一阶段采用TensorFlow对象检测模型来查找实体的2D裁剪。然后,第二阶段使用图像裁剪来估计3D边框,同时为下一帧计算实体的2D裁剪,因此实体检测器不需要运行每个帧。第二阶段3D边框预测器在Adreno 650移动GPU上以83 FPS运行。

a52aa03c-4ec2-11eb-8b86-12bb97331649.png

参考3D对象检测解决方案图

3D对象检测的评估指标

借助ground truth annotations,我们使用3Dintersection over union(IoU)相似度统计信息(一种用于计算机视觉任务的常用度量标准)来评估三维实体检测模型的性能,该度量标准衡量边框与地面真相的接近程度。

我们提出了一种算法,可为通用三维面向盒计算准确的3D IoU值。首先,我们使用Sutherland-Hodgman多边形裁剪算法计算两个盒子的面之间的交点。这类似于用于计算机图形学的视锥剔除技术。相交的体积由所有修剪的多边形的凸包计算。最后,根据两个框的交点的体积和并集的体积计算IoU。我们将在发表数据集的同时发布评估指标的源代码。

使用多边形裁剪算法计算并集的三维交点(左):通过对方框裁剪多边形计算每个面的交点。右:通过计算所有交点的凸包计算交点的体积(绿色)。

数据集格式

数据集的技术细节,包括用法和教程,可在数据集网站上找到。数据集包括自行车,书籍,瓶子,照相机,谷物盒,椅子,杯子,笔记本电脑和鞋子,并存储在Google Cloud存储上的objectron存储桶中,具有以下资源:

视频片段

注释标签(实体的3D边框)

AR元数据(例如照相机姿势,点云和平面)

已处理的数据集:带注释帧的改编版本,图像的格式为tf.example,视频的格式为SequenceExample。

支持脚本以基于上述指标运行评估

支持脚本以将数据加载到Tensorflow,PyTorch和Jax中并可视化数据集,包括“ Hello World”示例

有了数据集,我们还将开放数据管道,以在流行的Tensorflow,PyTorch和Jax框架中解析数据集。还提供了示例colab笔记本。

通过发布此Objectron数据集,我们希望使研究界能够突破三维实体几何理解的极限。我们还希望促进新的研究和应用。例如视图合成,改进的三维表达和无监督学习。加入我们的邮件列表并访问我们的github页面,请随时关注未来的活动和发展。

致谢

这篇文章中描述的研究是由Adel Ahmadyan, Liangkai Zhang, JianingWei, Artsiom Ablavatski, Mogan Shieh, Ryan Hickman, Buck Bourdon, Alexander Kanaukou, Chuo-Ling Chang, Matthias Grundmann, ‎and Tom Funkhouser完成的。我们感谢Aliaksandr Shyrokau,Sviatlana Mialik,Anna Eliseeva和注释团队的高质量注释。我们还要感谢Jonathan Huang和Vivek Rathod对TensorFlow对象检测API的指导。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测器
    +关注

    关注

    1

    文章

    946

    浏览量

    50092
  • Google
    +关注

    关注

    5

    文章

    1812

    浏览量

    60623
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26259

原文标题:Google发布Objectron数据集

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    VirtualLab:光学系统的三维可视化

    选项——视图设置 视图设置将打开另一个菜单与各种选项来自定义三维视图,如配色方案、视图工具或光线的描绘风格等。 配色方案-背景颜色 可用的配色方案是亮、中和暗。此外,用户可以决定
    发表于 04-13 09:04

    昊衡科技 多芯光纤三维形状传感系统,精准感知!

    光纤设备的三维形状传感系统,提供从数据采集到三维重构的全链路形状传感解决方案。该系统采用先进的多芯光纤作为传感载体,结合高精度OFDR解调技术和三维形状算法,解调
    的头像 发表于 01-14 17:56 569次阅读
    昊衡科技 多芯光纤<b class='flag-5'>三维</b>形状传感系统,精准感知!

    三维焊膏检测(SPI)技术与V310i Optimus系统的应用解析

    在现代电子制造领域,表面帖子技术(SMT)的精细化发展使得锡膏印刷质量监控变得尤为关键。 三维焊膏检测(SPI)系统作为SMT生产线上的关键质量监控设备,通过对印刷后焊膏的高度、面积、体积等三维参数
    的头像 发表于 11-12 11:16 641次阅读
    <b class='flag-5'>三维</b>焊膏<b class='flag-5'>检测</b>(SPI)技术与V310i Optimus系统的应用解析

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    ,推动高精度三维视觉技术的普及应用。2024年,先临三维营业收入超12亿元,业务遍及全球100+个国家和地区。 先临三维的高精度三维视觉技术深度应用于高精度工业3D扫描(
    的头像 发表于 11-11 14:55 889次阅读
    一文读懂 | <b class='flag-5'>三维</b>视觉领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    研华三维曲面AI检测方案有什么亮点

    2025工博会正如火如荼进行中,各家展台争奇斗艳,工业自动化百花齐放。研华三维曲面控制AI检测方案在其中悄然盛开。
    的头像 发表于 09-30 10:36 880次阅读

    三维扫描仪革命性升级:先临三维FreeScan Omni实现单机无线扫描+检测

    近日,先临三维作为三维扫描行业内的领军企业,凭借深厚的技术积累与持续的创新精神,成功推出了具有划时代意义的FreeScan Omni无线一体式手持三维扫描测量仪,引领了第代无线扫描技
    的头像 发表于 09-26 11:26 724次阅读
    <b class='flag-5'>三维</b>扫描仪革命性升级:先临<b class='flag-5'>三维</b>FreeScan Omni实现单机无线扫描+<b class='flag-5'>检测</b>

    软通动力与华为推出智能矿山三维地质分析解决方案

    在华为全联接大会2025中,软通动力联合华为发布智能矿山三维地质分析解决方案。作为双方在矿山智能化领域的创新突破,该方案已成功应用于某大型煤矿项目,落地成效显著,为行业智能化升级提供了可复用的标杆实践。
    的头像 发表于 09-22 09:47 956次阅读

    导远科技收获三维视觉技术客户批量订单

    导远科技近期成功获得国内知名三维视觉技术客户的批量订单。该客户旗下三维扫描仪产品已在三维设计、工业检测、文物保护、医疗健康等全球市场拥有卓越口碑。
    的头像 发表于 09-03 17:16 914次阅读

    请帮帮我:AutoCAD三维显示问题,和人正常视角相背

    AutoCAD三维显示问题,和人正常视角相背 AutoCAD三维显示问题,和人正常视角相背
    发表于 08-14 09:50

    蔡司三维扫描仪第方代抄数检测机构

    的手持式T-SCANhawk2三维激光扫描仪及GOMATOS系列光学三维扫描仪,正为全球制造业提供高效、精准的测试服务解决方案。技术核心优势:精准与效率的完美融合蔡司
    的头像 发表于 08-02 11:57 1202次阅读
    蔡司<b class='flag-5'>三维</b>扫描仪第<b class='flag-5'>三</b>方代抄数<b class='flag-5'>检测</b>机构

    三维扫描效率革命:自由维度(手持 / 机械臂)相较固定式方案的 N 倍产能提升

    三维扫描技术广泛应用的当下,固定式扫描方案受空间、操作流程等因素制约,难以满足高效生产需求。自由维度(手持 / 机械臂)三维扫描凭借灵活的作业模式与先进技术,实现了扫描效率的大幅飞跃,掀起行业效率
    的头像 发表于 07-14 13:57 778次阅读
    <b class='flag-5'>三维</b>扫描效率革命:自由维度(手持 / 机械臂)相较固定式<b class='flag-5'>方案</b>的 N 倍产能提升

    航天宏图全栈式3DGS实景三维重建系统解决方案

    “实景三维中国”作为国家推进数字中国建设、提升空间地理信息服务能力的重要战略性工程,正在深度融入低空经济、智能交通、智慧城市、数字文旅和应急指挥等关键领域。三维重建是实现真实世界“实景三维”数字化
    的头像 发表于 06-27 09:28 1940次阅读
    航天宏图全栈式3DGS实景<b class='flag-5'>三维</b>重建系统<b class='flag-5'>解决方案</b>

    VirtualLab:光学系统的三维可视化

    另一个菜单与各种选项来自定义三维视图,如配色方案、视图工具或光线的描绘风格等。 配色方案-背景颜色 可用的配色方案是亮、中和暗。此外,用户可以决定是否包括背景颜色渐变。 色彩
    发表于 05-30 08:45

    蔡司扫描仪ScanPort三维抄数建模一键式检测

    蔡司全新推出ZEISSScanPort扫描解决方案,专为自动化三维计量流程而设计。凭借其轴系统,无需编程,即可轻松获取中小型零部件的每一处细节。其高度移动性和模块化设计使其能够在铸造、增材制造
    的头像 发表于 05-24 12:01 807次阅读
    蔡司扫描仪ScanPort<b class='flag-5'>三维</b>抄数建模一键式<b class='flag-5'>检测</b>

    CASAIM与荣耀达成三维数字化检测技术合作

    近期,CASAIM与荣耀终端股份有限公司就终端消费电子产品的三维数字化检测展开深度合作,双方合作的首个项目将聚焦手机中框制造环节,借助三维数字化检测技术提升手机中框质量
    的头像 发表于 05-16 18:06 1079次阅读