多伦多大学&NVIDIA最新成果图像标注速度提升10倍-电子发烧友网

图像标注速度提升10倍！

这是多伦多大学与英伟达联合公布的一项最新研究：Curve-GCN的应用结果。

Curve-GCN是一种高效交互式图像标注方法，其性能优于Polygon-RNN++。在自动模式下运行时间为29.3ms，在交互模式下运行时间为2.6ms，比Polygon-RNN ++分别快10倍和100倍。

数据标注是人工智能产业的基础，在机器的世界里，图像与语音、视频等一样，是数据的一个种类。

对象实例分割是在图像中概括给定类的所有对象的问题，这一任务在过去几年受到了越来越多的关注，传统标记工具通常需要人工先在图片上点击光标描记物体边缘来进行标记。

然而，手动跟踪对象边界是一个费力的过程，每个对象大概需要30-60秒的时间。

为了缓解这个问题，已经提出了许多交互式图像分割技术，其通过重要因素加速注释。但是交互式分割方法大多是逐像素的（比如DEXTR），在颜色均匀的区域很难控制，所以最坏的情况下仍然需要很多点击。

Polygon-RNN将humans-in-the-loop（人机回圈）过程进行构架，在此过程中模型按顺序预测多边形的顶点。通过纠正错误的顶点，注释器可以在发生错误时进行干预。该模型通过调整校正来继续其预测。 Polygon-RNN显示在人类协议水平上产生注释，每个对象实例只需点击几下。这里最糟糕的情况是多边形顶点的数量，大多数对象的范围最多为30-40个点。

然而，模型的重复性将可扩展性限制为更复杂的形状，导致更难的训练和更长的推理。此外，期望注释器按顺序纠正错误，这在实践中通常是具有挑战性的。

最新研究成果中，研究人员将对象注释框架化为回归问题，其中所有顶点的位置被同时预测。

在Curve-GCN中，注释器会选择一个对象,然后选择多边形或样条轮廓。

Curve-GCN自动地勾勒出对象的轮廓

Curve-GCN允许交互式更正,并且可以自动重新预测多边形/样条

与Polygon-RNN + +相比：

Curve-GCN具有多边形或样条曲线参数

Curve-GCN可同时预测控制点（更快）

初始化预测

人工校正

模型校正

模型是在CityScapes数据集上训练的

自动模式下的比较。从左到右:ground-truth, Polygon-GCN, Spline-GCN, ps - deeplab

跨域自动模式。(上)cityscaps训练模型的开箱即用输出，(下)使用来自新领域的10%的数据进行微调。

多伦多大学&NVIDIA最新成果图像标注速度提升10倍

将Polygon和Spline-GCN与Polygon-RNN ++和PSP-DeepLab进行比较

模型在最先进的基础上进行了改进，速度显著加快，允许只具有局部效果的交互式更正，从而为注释器提供了更多的控制。这将导致更好的整体注释策略。

论文摘要

通过边界跟踪来手动标记对象是一个繁重的过程。在Polygon-RNN ++中，作者提出了Polygon-RNN，它使用CNN-RNN架构以循环方式产生多边形注释，允许通过humans-in-the-loop（人机回圈）的方式进行交互式校正。

我们提出了一个新的框架，通过使用图形卷积网络（GCN）同时预测所有顶点，减轻了Polygon-RNN的时序性。我们的模型是端到端训练的。它支持多边形或样条对对象进行标注，从而提高了基于线和曲线对象的标注效率。结果表明，在自动模式下，Curve-GCN的性能优于现有的所有方法，包括功能强大的PSP-DeepLab，并且在交互模式下，Curve-GCN的效率明显高于Polygon-RNN++。我们的模型在自动模式下运行29.3ms，在交互模式下运行2.6ms，比Polygon-RNN ++分别快10倍和100倍。

多伦多大学&NVIDIA最新成果图像标注速度提升10倍

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据

数据

+关注

关注
8

文章
7071

浏览量
89135
人工智能

人工智能

+关注

关注
1792

文章
47369

浏览量
238843
英伟达

英伟达

+关注

关注
22

文章
3782

浏览量
91229

原文标题：多伦多大学&NVIDIA最新成果：图像标注速度提升10倍！

文章出处：【微信号：IV_Technology，微信公众号：智车科技】欢迎添加关注！文章转载请注明出处。

AI自动图像标注工具SpeedDP将是数据标注行业发展的重要引擎

AI大浪潮下，许多企业都在不断借助AI来提升自己的行业竞争力，数据标注企业也不例外，传统人工标注效率不足的弊端困扰了多年，如今新的“引擎”就在眼前，他们当然不会放过这个机会。针对这样的需求，慧视光电

发表于 01-02 17:53 •111次阅读

AI自动<b class='flag-5'>图像</b><b class='flag-5'>标注</b>工具SpeedDP将是数据<b class='flag-5'>标注</b>行业发展的重要引擎

盘点NVIDIA 2024年的创新成果

在2024年，AI 的影响力已经扩展到加速计算和数据科学等多个关键领域，成为驱动各行各业技术革新和产业升级的关键因素。在这一年里，NVIDIA 又带来了哪些创新成果，实现了哪些突破？跟随本文一起盘点 NVIDIA 2024 年重

发表于 01-02 14:32 •112次阅读

标贝数据标注在智能驾驶训练中的落地案例

标贝科技深耕AI数据服务多年，在无人驾驶、自动驾驶等智能驾驶领域拥有丰富的合作案例。多次采用点云标注以及3D&amp;2D融合等标注方式为智能驾驶领域客户提供环境感知、决策策划、车道线标注

发表于 12-24 15:17 •485次阅读

NVIDIA Research在ECCV 2024上展示多项创新成果

在米兰举行的欧洲计算机视觉国际会议 (ECCV) 上，NVIDIA Research 展示了多项突破性的创新成果，共发表了 14 篇论文。

发表于 11-19 15:07 •323次阅读

极端数据采集引领计算机视觉应用新篇章

多伦多大学的计算成像研究人员用他们独特的相机捕捉到了奇怪的信号。多伦多计算机成像小组在实验室中使用单光子雪崩二极管 (SPAD) 相机检测到无法解释的 80 千赫 (kHz) 闪烁。他们利用强大

发表于 11-18 10:56 •211次阅读

SpeedDP！超便利AI自动图像标注工具功能丰富、省时省力

超级AI，在线标注，既能解放双手，又省时省力。传统的标注模式需要你对着目标不断拉框，反复机械的动作做多了就变得“麻木”，影响效率还使人烦恼。而SpeedDP的出现，可以有效的提升标注效

发表于 08-30 12:59 •298次阅读

多伦科技旗下金电科技亮相北京充换电展引领绿色出行新纪元

多伦科技旗下金电科技在发展过程中始终注重绿色生态的构建，坚持开放合作，通过共享资源、成果共创等方式，共同推动新能源汽车充电技术的快速发展与普及。

发表于 08-15 15:44 •480次阅读

慧视SpeedDP大模型打造图像标注新时代

在人工智能时代，图像标注不仅能够反哺AI的发展，还能进一步降低项目成本。传统的图像标注需要人工采用文本或者相应工具机械式的进行图像标签分配，

发表于 05-24 08:29 •571次阅读

多光子显微镜探究斑马鱼的社会行为

图 1：多伦多大学所用多光子显微镜系统中包括可调谐激光器 (Coherent Discovery) 和固定波长激光器 (Coherent Axon)，可节省宝贵的平台空间，同时改善成像灵活性

发表于 05-22 06:39 •239次阅读

龙芯：自主研发CPU提升性能，单核通用性能提高20倍

张戈强调，龙芯CPU的主要IP核均为自主研发，这使得其性价比得到显著提升。他指出，国产CPU与主流CPU的差距主要体现在单核性能上，而非多核性能。近年来，龙芯CPU的单核通用性能已提升了20倍，主频

发表于 04-25 15:26 •819次阅读

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将推理的稠密网络和热 Embedding 全置于 GPU 上进行

发表于 04-20 09:39 •751次阅读

人工图像标注1~2分钟，SpeedDP仅需7-8毫秒！降本增效不是梦！

在工作中你有没有遇到这样的问题，20万拿下一个项目，时间紧迫，但是项目有着大量的图像标注需求，如果单独招一个图像标注的工程师，光该岗位的工资成本就会花去四五万，毕竟项目结束了你总不能就

发表于 03-29 08:28 •579次阅读

新型散热材料金刚石纳米膜有望将电动汽车的充电速度提升五倍

近日，德国弗劳恩霍夫研究所 (Fraunhofer) 的科学家们利用超薄金刚石膜成功降低了电子元件的热负荷，并有望将电动汽车的充电速度提升五倍。

发表于 03-07 16:33 •1393次阅读

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型开发效率提升10倍

的潞晨科技Colossal-AI系统，用户可实现在本地算力平台一键训练、微调、推理、部署大模型，将大模型开发效率提升10倍以上，并将算力效率提升2-3

发表于 03-01 09:43 •496次阅读

利用NVIDIA产品技术组合提升用户体验

UTalk-Doc 将用户指令识别服务吞吐量提升了 5 倍，单个请求响应时间缩减了三分之一，大幅提升服务运行效率，提升资源利用率。Triton 模型分析能力还协助必优科技，将寻找最佳

发表于 01-17 09:30 •706次阅读

搜索历史

多伦多大学&NVIDIA最新成果图像标注速度提升10倍

评论

AI自动图像标注工具SpeedDP将是数据标注行业发展的重要引擎

盘点NVIDIA 2024年的创新成果

标贝数据标注在智能驾驶训练中的落地案例

NVIDIA Research在ECCV 2024上展示多项创新成果

极端数据采集引领计算机视觉应用新篇章

SpeedDP！超便利AI自动图像标注工具功能丰富、省时省力

多伦科技旗下金电科技亮相北京充换电展引领绿色出行新纪元

慧视SpeedDP大模型打造图像标注新时代

多光子显微镜探究斑马鱼的社会行为

龙芯：自主研发CPU提升性能，单核通用性能提高20倍

利用NVIDIA组件提升GPU推理的吞吐

人工图像标注1~2分钟，SpeedDP仅需7-8毫秒！降本增效不是梦！

新型散热材料金刚石纳米膜有望将电动汽车的充电速度提升五倍

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型开发效率提升10倍

利用NVIDIA产品技术组合提升用户体验

搜索历史

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

评论

多伦多大学&NVIDIA最新成果图像标注速度提升10倍