0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

ml8z_IV_Technol 来源:fqj 2019-05-05 09:51 次阅读

图像标注速度提升10倍!

这是多伦多大学与英伟达联合公布的一项最新研究:Curve-GCN的应用结果。

Curve-GCN是一种高效交互式图像标注方法,其性能优于Polygon-RNN++。在自动模式下运行时间为29.3ms,在交互模式下运行时间为2.6ms,比Polygon-RNN ++分别快10倍和100倍。

数据标注是人工智能产业的基础,在机器的世界里,图像与语音、视频等一样,是数据的一个种类。

对象实例分割是在图像中概括给定类的所有对象的问题,这一任务在过去几年受到了越来越多的关注,传统标记工具通常需要人工先在图片上点击光标描记物体边缘来进行标记。

然而,手动跟踪对象边界是一个费力的过程,每个对象大概需要30-60秒的时间。

为了缓解这个问题,已经提出了许多交互式图像分割技术,其通过重要因素加速注释。但是交互式分割方法大多是逐像素的(比如DEXTR),在颜色均匀的区域很难控制,所以最坏的情况下仍然需要很多点击。

Polygon-RNN将humans-in-the-loop(人机回圈)过程进行构架,在此过程中模型按顺序预测多边形的顶点。通过纠正错误的顶点,注释器可以在发生错误时进行干预。该模型通过调整校正来继续其预测。 Polygon-RNN显示在人类协议水平上产生注释,每个对象实例只需点击几下。这里最糟糕的情况是多边形顶点的数量,大多数对象的范围最多为30-40个点。

然而,模型的重复性将可扩展性限制为更复杂的形状,导致更难的训练和更长的推理。此外,期望注释器按顺序纠正错误,这在实践中通常是具有挑战性的。

最新研究成果中,研究人员将对象注释框架化为回归问题,其中所有顶点的位置被同时预测。

在Curve-GCN中,注释器会选择一个对象,然后选择多边形或样条轮廓。

Curve-GCN自动地勾勒出对象的轮廓

Curve-GCN允许交互式更正,并且可以自动重新预测多边形/样条

与Polygon-RNN + +相比:

Curve-GCN具有多边形或样条曲线参数

Curve-GCN可同时预测控制点(更快)

初始化预测

人工校正

模型校正

模型是在CityScapes数据集上训练的

自动模式下的比较。从左到右:ground-truth, Polygon-GCN, Spline-GCN, ps - deeplab

跨域自动模式。(上)cityscaps训练模型的开箱即用输出,(下)使用来自新领域的10%的数据进行微调。

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

将Polygon和Spline-GCN与Polygon-RNN ++和PSP-DeepLab进行比较

模型在最先进的基础上进行了改进,速度显著加快,允许只具有局部效果的交互式更正,从而为注释器提供了更多的控制。这将导致更好的整体注释策略。

论文摘要

通过边界跟踪来手动标记对象是一个繁重的过程。在Polygon-RNN ++中,作者提出了Polygon-RNN,它使用CNN-RNN架构以循环方式产生多边形注释,允许通过humans-in-the-loop(人机回圈)的方式进行交互式校正。

我们提出了一个新的框架,通过使用图形卷积网络(GCN)同时预测所有顶点,减轻了Polygon-RNN的时序性。我们的模型是端到端训练的。它支持多边形或样条对对象进行标注,从而提高了基于线和曲线对象的标注效率。结果表明,在自动模式下,Curve-GCN的性能优于现有的所有方法,包括功能强大的PSP-DeepLab,并且在交互模式下,Curve-GCN的效率明显高于Polygon-RNN++。我们的模型在自动模式下运行29.3ms,在交互模式下运行2.6ms,比Polygon-RNN ++分别快10倍和100倍。

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6914

    浏览量

    88852
  • 人工智能
    +关注

    关注

    1791

    文章

    46915

    浏览量

    237715
  • 英伟达
    +关注

    关注

    22

    文章

    3749

    浏览量

    90873

原文标题:多伦多大学&NVIDIA最新成果:图像标注速度提升10倍!

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA Research在ECCV 2024上展示多项创新成果

    在米兰举行的欧洲计算机视觉国际会议 (ECCV) 上,NVIDIA Research 展示了多项突破性的创新成果,共发表了 14 篇论文。
    的头像 发表于 11-19 15:07 254次阅读

    极端数据采集引领计算机视觉应用新篇章

    多伦多大学的计算成像研究人员用他们独特的相机捕捉到了奇怪的信号。多伦多计算机成像小组在实验室中使用单光子雪崩二极管 (SPAD) 相机检测到无法解释的 80 千赫 (kHz) 闪烁。 他们利用强大
    的头像 发表于 11-18 10:56 152次阅读

    SpeedDP! 超便利AI自动图像标注工具 功能丰富、省时省力

    超级AI,在线标注,既能解放双手,又省时省力。传统的标注模式需要你对着目标不断拉框,反复机械的动作做多了就变得“麻木”,影响效率还使人烦恼。而SpeedDP的出现,可以有效的提升标注
    的头像 发表于 08-30 12:59 253次阅读
    SpeedDP! 超便利AI自动<b class='flag-5'>图像</b><b class='flag-5'>标注</b>工具   功能丰富、省时省力

    多伦科技旗下金电科技亮相北京充换电展 引领绿色出行新纪元

    多伦科技旗下金电科技在发展过程中始终注重绿色生态的构建,坚持开放合作,通过共享资源、成果共创等方式,共同推动新能源汽车充电技术的快速发展与普及。
    的头像 发表于 08-15 15:44 438次阅读
    <b class='flag-5'>多伦</b>科技旗下金电科技亮相北京充换电展 引领绿色出行新纪元

    慧视SpeedDP大模型打造图像标注新时代

    在人工智能时代,图像标注不仅能够反哺AI的发展,还能进一步降低项目成本。传统的图像标注需要人工采用文本或者相应工具机械式的进行图像标签分配,
    的头像 发表于 05-24 08:29 516次阅读
    慧视SpeedDP大模型打造<b class='flag-5'>图像</b><b class='flag-5'>标注</b>新时代

    多光子显微镜探究斑马鱼的社会行为

    图 1:多伦多大学所用多光子显微镜系统中包括可调谐 激光器 (Coherent Discovery) 和固定波长激光器 (Coherent Axon),可节省宝贵的平台空间,同时改善成像灵活性
    的头像 发表于 05-22 06:39 200次阅读
    多光子显微镜探究斑马鱼的社会行为

    龙芯:自主研发CPU提升性能,单核通用性能提高20

    张戈强调,龙芯CPU的主要IP核均为自主研发,这使得其性价比得到显著提升。他指出,国产CPU与主流CPU的差距主要体现在单核性能上,而非多核性能。近年来,龙芯CPU的单核通用性能已提升了20,主频
    的头像 发表于 04-25 15:26 767次阅读

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热 Embedding 全置于 GPU 上进行
    的头像 发表于 04-20 09:39 653次阅读

    人工图像标注1~2分钟,SpeedDP仅需7-8毫秒!降本增效不是梦!

    在工作中你有没有遇到这样的问题,20万拿下一个项目,时间紧迫,但是项目有着大量的图像标注需求,如果单独招一个图像标注的工程师,光该岗位的工资成本就会花去四五万,毕竟项目结束了你总不能就
    的头像 发表于 03-29 08:28 539次阅读
    人工<b class='flag-5'>图像</b><b class='flag-5'>标注</b>1~2分钟,SpeedDP仅需7-8毫秒!降本增效不是梦!

    新型散热材料金刚石纳米膜有望将电动汽车的充电速度提升

    近日,德国弗劳恩霍夫研究所 (Fraunhofer) 的科学家们利用超薄金刚石膜成功降低了电子元件的热负荷,并有望将电动汽车的充电速度提升
    的头像 发表于 03-07 16:33 1335次阅读
    新型散热材料金刚石纳米膜有望将电动汽车的充电<b class='flag-5'>速度</b><b class='flag-5'>提升</b>五<b class='flag-5'>倍</b>

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10

    的潞晨科技Colossal-AI系统,用户可实现在本地算力平台一键训练、微调、推理、部署大模型,将大模型开发效率提升10以上,并将算力效率提升2-3
    的头像 发表于 03-01 09:43 459次阅读
    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率<b class='flag-5'>提升</b><b class='flag-5'>10</b><b class='flag-5'>倍</b>

    利用NVIDIA产品技术组合提升用户体验

    UTalk-Doc 将用户指令识别服务吞吐量提升了 5 ,单个请求响应时间缩减了三分之一,大幅提升服务运行效率,提升资源利用率。Triton 模型分析能力还协助必优科技,将寻找最佳
    的头像 发表于 01-17 09:30 664次阅读

    利用AI实现自动图像标注不是梦

    一次次的将图像添加标签进行分类,如此机械式的操作是否令你心烦?为不多不少的图像分类标注工作不得不增加一个岗位?你是否因图像标注需求和数据安全
    的头像 发表于 01-04 08:29 1263次阅读
    利用AI实现自动<b class='flag-5'>图像</b><b class='flag-5'>标注</b>不是梦

    视觉 AI “落地”加拿大最大、最繁忙的多伦多皮尔逊国际机场

    NVIDIA Metropolis 视觉 AI 合作伙伴生态系统 成员 Zensors 在多伦多皮尔逊国际机场部署视觉 AI 平台,大幅缩短了海关排队等候时间。 多伦多皮尔逊国际机场位于加拿大
    的头像 发表于 12-21 19:35 640次阅读

    图像标注如何提升效率?

    图像标注是通过一定方式对图像进行标记分类,是对数据集的图像进行标记以训练机器学习模型的过程。当图像数量可控时,用人工
    的头像 发表于 12-19 08:29 444次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>标注</b>如何<b class='flag-5'>提升</b>效率?