0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

戴维斯分校提出实时分割框架YOLACT突破速度边界

nlfO_thejiangme 来源:lp 2019-05-01 14:31 次阅读

深度学习计算机视觉领域取得了巨大成功,在分类、检测甚至跟踪任务上都有了巨大的进步,可以产生实时的高质量预测,但高速的实例分割的发展却落后于目标检测的进步。在目标检测领域,我们已经拥有了高效的SSD和YOLO,但实例分割领域对于模型表现更多的重视、使得网络的速度进展缓慢。

SSD和YOLO的加速主要通过移除Faster R-CNN这类网络的第二个阶段,通过单阶段来提升速度,并通过其他的手段来弥补精度的下降。但实例分割的难度远大于目标检测,这样的方法不能简单的拓展到实例分割中。先进的实例分割算法强烈依赖于特征的定位来预测mask,通过将特定区域的特征进行“池化”后输入到mask预测器中,这种串行的运行的方法难以加速。虽然也有像FCIS等单阶段的方法,但他们却需要较为复杂的后处理操作,难以保证实时性。

为了解决这个问题、提高实例分割的速度,研究人员提出了一种快速、单阶段的实例分割模型YOLACT,在单个Titan Xp上实现了30帧以上的实例分割速度,并在MS COCO上实现了约30mAP的表现。这种方法抛弃了先前方法中的定位步骤,将实例分割分为了两个并行的任务:一方面在整幅图像上生成一系列mask原型,另一方面为每个实例预测出一系列线性叠加系数。随后对于图中的每个实例,基于线性叠加系数对原型mask进行组合并利用预测框进行剪切实现最后的实例输出。在此过程中,网络学会了如何定位不同位置、颜色和语义实例的mask。

此外,由于mask原型的预测不依赖于类别的数量,这一模型学习到如何组合mask原型的表示可以被所用类别所共享。这种表示的学习使得原型空间可以表示图像中不同的位置、定位实例、检测边缘和编码位置敏感信息,并对这些结果进行有效组合。

YOLACT通过并行的计算架构和轻量化的组合过程加速了实例分割的过程,在单阶段检测基础网络上仅仅添加了少量的计算,使得它可以轻松达到30fps。

YOLACT预测的mask由于充分利用了图像空间的信息,不受特征池化的影响,对于大物体预测有着明显的提升。而这种基于mask原型和mask系数的思想可以移植到很多先进的目标检测架构上,实现快速精确的实例分割。

具体实现

先前的实例分割主要在提升精度上下功夫,Mask-RCNN是两阶段方法的代表,而单阶段的方法主要基于位置敏感图池化来实现实例分割,这些计算极大的限制了模型运行的速度。而目前的实时实例分割方法要么在精度上无法与先进的实例分割方法比拟,要么所面对的分割情形较为简单。

在这篇文章的工作中,研究人员通过在现有的单阶段目标检测网络上加上mask预测分支,但去除了精确的定位步骤(eg feature repooling)。在模型中一个分支利用FCN来产生一系列不依赖与实例的原型mask,第二个分支则是在目标检测模块后加上了预测mask系数的结构(每个 anchor),用于编码实例在原型空间中的表示。

研究人员首先利用FCN实现了对于原型mask的预测。在基础网络特征层后添加了输出为k通道的Protonet,它将生成k个独立的mask原型。为了保证生成原型mask的稳定,研究人员选用了基础网络中更深层的特征图,这还有益于提高原型mask的分辨率,对于提高mask的质量和小物体的效果有着重要的作用。

对于mask系数的预测,研究人员对现有的单阶段目标检测网络进行了改造,为每个anchor添加了k个预测,并利用tanh对k个系数进行操作提高稳定性。

最后对生成的mask原型和系数进行线性组合即可得到最终的mask。

值得一提的是,研究人员还在这一工作中实现了一种快速非极大值抑制方法Fast NMS,比传统的方法提高了11-16ms的速度。通过基于GPU实现的批量排序算法和IoU计算实现了加速,并利用矩阵运算和阈值找到每类需要保留的检测结果。最后,研究人员还使用了语义分割损失在训练中补偿FastNMS带来的下降(0.1-0.3mAP),通过在基础网络P3上添加1*1卷积,和sigmoid激活实现了0.4mAP的提升。

下表显示了YOLACT在不同基础网络与输入图像尺寸上的表现,可以看到在保持较高mAP时实现了较快的速度。

FastNMS算法只会造成算法表现轻微的下降,但在速度上有较大的提升:

让我们再来围观一下网络的表现,对于重叠的物体表现依旧优异:

目前这一代码已经开源,可以在下面的地址中找到:code:https://github.com/dbolya/yolact它基于Pytorch 1.0.1实现,并依赖于一些额外的python包:

# Cython needs to be installed before pycocotoolspip install cython opencv-python pillow pycocotools matplotlib

直接将代码下载到本地即可开始调试:

git clone https://github.com/dbolya/yolact.gitcd yolact

现在就可以开始进行训练或者测试了,当然测试之前需要先下载coco数据集

# Train setsh data/scripts/COCO.sh# Test setsh data/scripts/COCO.sh

# Display qualitative results on the specified image.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.3 --top_k=100 --image=my_image.png# Display qualitative results on the specified image.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.3 --top_k=100 --image=input_image.png:output_image.png# Process a whole folder of images.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.3 --top_k=100 --images=path/to/input/folder:path/to/output/folder

愉快的开始分割吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1081

    浏览量

    40386
  • 计算机视觉
    +关注

    关注

    8

    文章

    1695

    浏览量

    45911
  • 深度学习
    +关注

    关注

    73

    文章

    5481

    浏览量

    120918

原文标题:实例分割太慢怎么破?戴维斯分校提出实时分割框架YOLACT突破速度边界

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一种基于音调的语音/音乐实时分类算法

    【作者】:吴顺妹;许丽净;许洪光;张钦宇;【来源】:《电声技术》2010年02期【摘要】:语音/音乐的实时分类,在语音/音乐通用编码器中是尤其重要的。分析了语音和音乐的区别性特征,提出了一种利用音调
    发表于 04-23 11:13

    通过任务分割提高嵌入式系统的实时

    分析长任务对嵌入式系统实时性的影响,在此基础上提出任务分割是提高嵌入式系统实时性的一种有效途径; 总结长任务分割的方法, 给出一个通过任务
    发表于 05-15 15:07 4次下载

    图像分割和图像边缘检测

     图像分割的研究多年来一直受到人们的高度重视,至今提出了各种类型的分割算法。Pal把图像分割算法分成了6类:阈值分割,像素
    发表于 12-19 09:29 1.1w次阅读
    图像<b class='flag-5'>分割</b>和图像边缘检测

    加州大学戴维分校利用RFID跟踪蜂鸟活动

    由加州大学戴维分校兽医学院和该大学的疾病动力学中心进行的这项研究,并不是第一个使用RFID跟踪蜂鸟的研究,加州大学戴维
    的头像 发表于 02-11 14:01 2242次阅读

    如何进行面向农业应用的无人机遥感影像地块边界提取资料说明

    针对无人机(UAV)影像农田 场景地块边界提取过程中由于大幅面、高分辨率和地块尺寸 大小不一致等带来的过分割问题,提出了一种基于多尺度分割的地块边界
    发表于 03-28 16:21 8次下载
    如何进行面向农业应用的无人机遥感影像地块<b class='flag-5'>边界</b>提取资料说明

    高通财务长戴维宣布离职 将转任英特尔财务长

    芯片大厂高通和英特尔周二表示,高通财务长戴维(George Davis)已离职,将转任英特尔财务长。
    的头像 发表于 04-03 17:32 2838次阅读

    算法 | 超Mask RCNN速度4倍,仅在单个GPU训练的实时实例分割算法

    YOLACT——Real-time Instance Segmentation提出了一种简洁的实时实例分割全卷积模型,速度明显优于以往已有的
    的头像 发表于 06-11 10:34 7232次阅读

    使用无人机进行农业边界提取的遥感影像说明

    针对无人机( UAV)影像农田场景地块边界提取过程中由于大幅面、高分辨率和地块尺寸大小不一致等带来的过分割问题,提出了一种基于多尺度分割的地块边界
    发表于 10-24 16:18 4次下载

    如何使用无人机遥感影像地块边界提取应用在农业方面详细资料概述

    针对无人机影像农田场景地块边界提取过程中由于大幅面、高分辨率和地块尺寸大小不一致等带来的过分割问题,提出了一种基于多尺度分割的地块边界自动化
    发表于 07-13 17:09 19次下载
    如何使用无人机遥感影像地块<b class='flag-5'>边界</b>提取应用在农业方面详细资料概述

    详解ENet:CPU可以实时的道路分割网络

    OpenCV DNN模块支持的图像语义分割网络FCN是基于VGG16作为基础网络,运行速度很慢,无法做到实时语义分割。2016年提出的ENe
    的头像 发表于 12-15 00:18 651次阅读

    基于遥感数据的海岛边界快速分割模型

    基于遥感数据的海岛边界快速分割模型
    发表于 06-11 15:32 4次下载

    用于弱监督大规模点云语义分割的混合对比正则化框架

    为了解决大规模点云语义分割中的巨大标记成本,我们提出了一种新的弱监督环境下的混合对比正则化(HybridCR)框架,该框架与全监督的框架相比
    的头像 发表于 09-05 14:38 1311次阅读

    中科院提出FastSAM快速分割一切模型!比Meta原版提速50倍!

    通过将分割⼀切任务重新划分为全实例分割和提⽰指导选择两个⼦任务,⽤带实例分割分⽀的常规 CNN 检测器以⾼出50倍的运⾏速度实现了与SAM⽅法相当的性能,是⾸个
    的头像 发表于 06-28 14:33 1595次阅读
    中科院<b class='flag-5'>提出</b>FastSAM快速<b class='flag-5'>分割</b>一切模型!比Meta原版提速50倍!

    赛道清晰,红利兑现,AI有望实现戴维双击.zip

    赛道清晰,红利兑现,AI有望实现戴维双击
    发表于 01-13 09:07 1次下载

    戴维正弦发生器应用说明

    电子发烧友网站提供《戴维正弦发生器应用说明.pdf》资料免费下载
    发表于 09-10 09:39 0次下载
    <b class='flag-5'>戴维</b><b class='flag-5'>斯</b>正弦发生器应用说明