0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

ml8z_IV_Technol 来源:fqj 2019-05-05 09:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

图像标注速度提升10倍!

这是多伦多大学与英伟达联合公布的一项最新研究:Curve-GCN的应用结果。

Curve-GCN是一种高效交互式图像标注方法,其性能优于Polygon-RNN++。在自动模式下运行时间为29.3ms,在交互模式下运行时间为2.6ms,比Polygon-RNN ++分别快10倍和100倍。

数据标注是人工智能产业的基础,在机器的世界里,图像与语音、视频等一样,是数据的一个种类。

对象实例分割是在图像中概括给定类的所有对象的问题,这一任务在过去几年受到了越来越多的关注,传统标记工具通常需要人工先在图片上点击光标描记物体边缘来进行标记。

然而,手动跟踪对象边界是一个费力的过程,每个对象大概需要30-60秒的时间。

为了缓解这个问题,已经提出了许多交互式图像分割技术,其通过重要因素加速注释。但是交互式分割方法大多是逐像素的(比如DEXTR),在颜色均匀的区域很难控制,所以最坏的情况下仍然需要很多点击。

Polygon-RNN将humans-in-the-loop(人机回圈)过程进行构架,在此过程中模型按顺序预测多边形的顶点。通过纠正错误的顶点,注释器可以在发生错误时进行干预。该模型通过调整校正来继续其预测。 Polygon-RNN显示在人类协议水平上产生注释,每个对象实例只需点击几下。这里最糟糕的情况是多边形顶点的数量,大多数对象的范围最多为30-40个点。

然而,模型的重复性将可扩展性限制为更复杂的形状,导致更难的训练和更长的推理。此外,期望注释器按顺序纠正错误,这在实践中通常是具有挑战性的。

最新研究成果中,研究人员将对象注释框架化为回归问题,其中所有顶点的位置被同时预测。

在Curve-GCN中,注释器会选择一个对象,然后选择多边形或样条轮廓。

Curve-GCN自动地勾勒出对象的轮廓

Curve-GCN允许交互式更正,并且可以自动重新预测多边形/样条

与Polygon-RNN + +相比:

Curve-GCN具有多边形或样条曲线参数

Curve-GCN可同时预测控制点(更快)

初始化预测

人工校正

模型校正

模型是在CityScapes数据集上训练的

自动模式下的比较。从左到右:ground-truth, Polygon-GCN, Spline-GCN, ps - deeplab

跨域自动模式。(上)cityscaps训练模型的开箱即用输出,(下)使用来自新领域的10%的数据进行微调。

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

将Polygon和Spline-GCN与Polygon-RNN ++和PSP-DeepLab进行比较

模型在最先进的基础上进行了改进,速度显著加快,允许只具有局部效果的交互式更正,从而为注释器提供了更多的控制。这将导致更好的整体注释策略。

论文摘要

通过边界跟踪来手动标记对象是一个繁重的过程。在Polygon-RNN ++中,作者提出了Polygon-RNN,它使用CNN-RNN架构以循环方式产生多边形注释,允许通过humans-in-the-loop(人机回圈)的方式进行交互式校正。

我们提出了一个新的框架,通过使用图形卷积网络(GCN)同时预测所有顶点,减轻了Polygon-RNN的时序性。我们的模型是端到端训练的。它支持多边形或样条对对象进行标注,从而提高了基于线和曲线对象的标注效率。结果表明,在自动模式下,Curve-GCN的性能优于现有的所有方法,包括功能强大的PSP-DeepLab,并且在交互模式下,Curve-GCN的效率明显高于Polygon-RNN++。我们的模型在自动模式下运行29.3ms,在交互模式下运行2.6ms,比Polygon-RNN ++分别快10倍和100倍。

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7348

    浏览量

    95017
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266933
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99616

原文标题:多伦多大学&NVIDIA最新成果:图像标注速度提升10倍!

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    BlackBerry QNX与NVIDIA深化合作

    BlackBerry有限公司(纽约证券交易所代码:BB;多伦多证券交易所代码:BB)旗下业务部门QNX 今日宣布,进一步扩大与NVIDIA的合作,助力开发者基于NVIDIA IGX Thor 平台
    的头像 发表于 04-23 11:23 308次阅读

    NVIDIA推出Vera CPU以显著提升系统性能与能效

    NVIDIA 今日发布 NVIDIA Vera CPU,这是全球首款专为代理式 AI 与强化学习时代打造的处理器,其效率是传统机架级 CPU 的 2 速度
    的头像 发表于 03-18 14:33 1657次阅读

    ADI携最新成果亮相NVIDIA GTC 2026

    NVIDIA GTC 2026大会于3月16日重返圣何塞举办,ADI携最新成果参展,呈现物理智能为机器人领域带来的革新。
    的头像 发表于 03-18 11:48 683次阅读

    北大团队最新研究:AI芯片算力提升数倍,能效提升超90

    首次实现后摩尔新器件异质集成的多物理域融合傅里叶变换系统。   这一全新计算架构将傅里叶变换计算速度从当前每秒约1300亿次提升至每秒约5000亿次,算力提升近4,能效
    的头像 发表于 01-15 09:31 2233次阅读

    算法工程师不愿做标注工作,怎么办?

    对于算法而言,图像标注是一项关键性工作,越是大量的新数据集标注,对于算法的性能提升越有帮助。但是图像标注
    的头像 发表于 12-02 17:56 695次阅读
    算法工程师不愿做<b class='flag-5'>标注</b>工作,怎么办?

    NVIDIA Jetson AGX Thor Developer Kit开发环境配置指南

    NVIDIA Jetson AGX Thor 专为物理 AI 打造,与上一代产品 NVIDIA Jetson AGX Orin 相比,生成式 AI 性能最高提升至 5 。通过发布后的
    的头像 发表于 11-08 09:55 7646次阅读
    <b class='flag-5'>NVIDIA</b> Jetson AGX Thor Developer Kit开发环境配置指南

    新技术可提升紫外线传感器响应速度

    研究示意图 澳大利亚麦考瑞大学科学家开发了一项新技术,将紫外线传感器的响应速度提高了128000。该成果有望催生更高效、更灵活的可穿戴设备。相关论文发表于新一期《Small》杂志。
    的头像 发表于 11-07 09:13 408次阅读
    新技术可<b class='flag-5'>提升</b>紫外线传感器响应<b class='flag-5'>速度</b>

    小语种OCR标注效率提升10+:PaddleOCR+ERNIE 4.5自动标注实战解析

    摘要 :小语种OCR研发的核心瓶颈在于高质量标注数据的稀缺与高昂成本。本文介绍一种创新的自动化标注方案,利用 PaddleOCR 进行文本检测与裁剪,并调用 ERNIE 4.5 大模型进行双重预测
    的头像 发表于 08-29 11:26 3879次阅读
    小语种OCR<b class='flag-5'>标注</b>效率<b class='flag-5'>提升</b><b class='flag-5'>10</b>+<b class='flag-5'>倍</b>:PaddleOCR+ERNIE 4.5自动<b class='flag-5'>标注</b>实战解析

    自动驾驶数据标注主要是标注什么?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的研发过程中,数据标注是实现高性能感知模型的基础环节,其核心目标是将车辆从环境中采集到的原始感知数据(主要包括图像、点云、视频序列等)转化为具有语义信息
    的头像 发表于 07-30 11:54 1618次阅读
    自动驾驶数据<b class='flag-5'>标注</b>主要是<b class='flag-5'>标注</b>什么?

    NVIDIA展示机器人领域的研究成果

    在今年的机器人科学与系统会议 (RSS) 上,NVIDIA 研究中心展示了一系列推动机器人学习的研究成果,展示了在仿真、现实世界迁移和决策制定领域的突破。
    的头像 发表于 07-23 10:43 1644次阅读

    什么是自动驾驶数据标注?如何好做数据标注

    、精准且高效的数据标注流程显得尤为关键。那什么是数据标注?如何做数据标注? 自动驾驶数据标注是指在自动驾驶系统所采集的感知数据(如摄像头图像
    的头像 发表于 07-09 09:19 1640次阅读
    什么是自动驾驶数据<b class='flag-5'>标注</b>?如何好做数据<b class='flag-5'>标注</b>?

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    前将 67 token / 秒 (TPS) 的速度提升至 253 TPS(提速 3.7 ),而目前这一速度已达 368 TPS(提速 5.5
    的头像 发表于 07-02 19:31 3561次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    NVIDIA在ICRA 2025展示多项最新研究成果

    在亚特兰大举行的国际机器人与自动化大会 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控领域的多项研究成果
    的头像 发表于 06-06 14:56 1585次阅读

    AI时代 图像标注不要没苦硬吃

    识别算法的性能提升依靠大量的图像标注,传统模式下,需要人工对同类型数据集进行一步步手动拉框,这个过程的痛苦只有做过的人才知道。越多素材的数据集对于算法的提升越有帮助,常规情况下,一个2
    的头像 发表于 05-20 17:54 640次阅读
    AI时代   <b class='flag-5'>图像</b><b class='flag-5'>标注</b>不要没苦硬吃

    意法半导体收购多伦多初创公司Deeplite,助力边缘AI技术发展!

    近日,意法半导体(STMicroelectronics,简称ST)宣布已成功收购加拿大多伦多的初创公司Deeplite。这一战略性收购旨在加强意法半导体在边缘人工智能(AI)技术领域的布局,并将
    的头像 发表于 04-28 11:28 1252次阅读
    意法半导体收购<b class='flag-5'>多伦多</b>初创公司Deeplite,助力边缘AI技术发展!