0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员共同提出了一种面向目标检测任务的新模块Res2Net

DPVg_AI_era 来源:lp 2019-04-08 09:26 次阅读

近日,南开大学、牛津大学和加州大学默塞德分校的研究人员共同提出了一种面向目标检测任务的新模块Res2Net,新模块可以和现有其他优秀模块轻松整合,在不增加计算负载量的情况下,在ImageNet、CIFAR-100等数据集上的测试性能超过了ResNet。

2015年,由何恺明等四位华人所提出的ResNet一战成名,可极快的加速神经网络的训练。

而近日,由南开大学、牛津大学和加州大学默塞德分校的研究人员共同提出的Res2Net,可以和现有其他优秀模块轻松整合:在不增加计算负载量的情况下,在ImageNet、CIFAR-100等数据集上的测试性能超过了ResNet。

论文地址:

https://arxiv.org/pdf/1904.01169.pdf

关于代表性计算机视觉任务的进一步消融研究和实验结果,即目标检测,类激活 mapping和显著目标检测,进一步验证了Res2Net相对于现有技术的基线方法的优越性。

面向视觉任务的多尺度表示对于目标检测、语义分割和显著目标检测任务具有重大意义。通过CNN新模块Res2Net,能够实现与比以往优秀的基于CNNbackbone的模型(如ResNet,ResNeXt和DLA)更好的性能表现。

Res2Net:计算负载不增加,特征提取能力更强大

在多个尺度上表示特征对于许多视觉任务非常重要。卷积神经网络(CNN) backbone 的最新进展不断展示出更强的多尺度表示能力,从而在广泛的应用中实现一致的性能提升。然而,大多数现有方法以分层方式(layer-wise)表示多尺度特征。

在本文中,研究人员在一个单个残差块内构造分层的残差类连接,为CNN提出了一种新的构建模块,即Res2Net——以更细粒度(granular level)表示多尺度特征,并增加每个网络层的感受野(receptive fields)范围。

上图中,左侧为CNN网络架构的基本构成,右侧为本文新提出的Res2Net模块。新模块具备更强的多规模特征提取能力,但计算负载量与左侧架构类似。具体而言,新模块用一个较小的3×3过滤器取代了过滤器组,同时可以将不同的过滤器组以层级残差式风格连接。模块内部的连接形式与残差网络(ResNet)类似,故命名为Res2Net。

与其他现有模块的整合

本文所提出的Res2Net模块可以融合到最先进的backbone CNN模型中,例如ResNet,ResNeXt和DLA。研究人员在所有这些模型上评估 Res2Net 模块,并在广泛使用的数据集(例如CIFAR-100和ImageNet)上展示相对于基线模型的一致性能提升。

由于单独的Res2Net模块对于整体网络结构没有特定的要求,Res2Net模块的多尺度表示能力也和CNN的分层特征聚合模型彼此独立,所以可以很容易地将Res2Net模块集成到现有的其他优秀CNN模型中。比如ResNet,ResNeXt 和DLA 等。集成后的模型可称为Res2Net,Res2NeXt,和Res2Net-DLA。

Res2Net模块性能及测试结果

ImageNet数据集测试结果

ImageNet数据集Top1和Top5测试结果

Res2Net-50在ImageNet数据集不同规模测试错误率结果。其中参数w为过滤器宽度,s为scale

CIFAR-100数据集测试结果

CIFAR-100数据集Top1错误率,以及模型大小

CIFAR-100数据集不同模型大小下的检测准确率

ResNet-50和Res2Net-50的类激活映射可视化对比

ResNet-101 和Res2Net-101的语义分割结果的可视化对比

ResNet-50 和Res2Net-50的显著目标检测结果对比(图7)

结论及未来方向

Res2Net结构简单,性能优秀,可以进一步探索CNN在更细粒度级别的多尺度表示能力。 Res2Net揭示了一个新的维度,即“尺度”(Scale),除了深度,宽度和基数的现有维度之外,“规模”是一个必不可少的更有效的因素。

Res2Net模块可以很容易地与现有的最新模块整合。对CIFAR100和ImageNet基准测试的图像分类结果表明,使用Res2Net模块的网络始终在与对手的竞争中表现出更优秀的性能,这些对手包括ResNet,ResNeXt,DLA等。

Res2Net性能上的优越性已经在几个具有代表性的计算机视觉任务体现出来,包括类激活映射,对象检测和显着对象检测等。多尺度表示对于未来开拓更广泛的应用领域至关重要。

本文相关源代码将在论文被收稿后公开发布。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4769

    浏览量

    100685
  • 计算机视觉
    +关注

    关注

    8

    文章

    1698

    浏览量

    45964
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24683

原文标题:超越ResNet:南开提出Res2Net,不增计算负载,性能全面升级!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    美国普渡大学和哈佛大学的研究人员出了项新发明 新...

    据物理学家组织网报道,美国普渡大学和哈佛大学的研究人员出了项极为应景的新发明:一种外形如同颗圣诞树
    发表于 02-03 20:30

    一种基于图像平移的目标检测框架

    集。本文提出了一种基于图像平移的目标检测框架,以解决在不利条件下目标检测精度下降的问题。我们
    发表于 08-31 07:43

    一种专门用于检测目标的框架Dilated Module

    1. 介绍本文提出一种专门用于检测目标的框架,框架结构如下图:我们探索了可以提高小目标检测能力
    发表于 11-04 11:14

    一种改进运动目标检测算法的研究与应用

    针对运动目标检测中场景的混乱多变和干扰的复杂多样的问题,提出了一种鲁棒而有效的运动目标检测方法。
    发表于 02-22 15:01 3次下载

    研究人员提出了一种柔性可拉伸扩展的多功能集成传感器阵列

    研究人员提出了一种柔性可拉伸扩展的多功能集成传感器阵列,成功将电子皮肤的探测能力扩展到7,实现温度、湿度、紫外光、磁、应变、压力和接近等多种外界刺激的实时同步监测。
    的头像 发表于 01-24 15:15 7233次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b><b class='flag-5'>一种</b>柔性可拉伸扩展的多功能集成传感器阵列

    实验室的最新工作——Res2Net一种目标检测任务中新的Backbone网络模块

    因此,多尺度的特征在传统方法和深度学习里面都得到了广泛应用。通常我们需要采用个大感受野的特征提取器来获得不同尺度的特征描述,而卷积神经网络通过堆卷积层可以很自然的由粗到细多尺度的提取特征。如何设计更高效的网络结构是提升卷积神经网络性能的关键。
    的头像 发表于 04-08 14:33 8460次阅读
    实验室的最新工作——<b class='flag-5'>Res2Net</b>,<b class='flag-5'>一种</b>在<b class='flag-5'>目标</b><b class='flag-5'>检测</b><b class='flag-5'>任务</b>中新的Backbone网络<b class='flag-5'>模块</b>

    以色列研究人员开发出了一种能够识别不同刺激的新型传感系统

    据麦姆斯咨询报道,海法以色列理工学院的研究人员开发出了一种能够识别并区分不同刺激的创新型传感系统。该系统基于折纸艺术,结合了以色列理工学院开发的智能墨水材料。
    发表于 05-21 08:45 903次阅读

    研究人员提出了系列新的点云处理模块

    为了探索这些问题的解决办法、来自伦敦大学学院的研究人员提出了系列新的点云处理模块,从效率、信息共享和点云卷积操作等方面进行了研究,得到了
    的头像 发表于 08-02 14:44 3055次阅读
    <b class='flag-5'>研究人员</b>们<b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的点云处理<b class='flag-5'>模块</b>

    JD和OPPO的研究人员提出了一种姿势引导的时尚图像生成模型

    研究人员的主要目的在于训练个生成模型,将模特在当前姿势上的图像迁移到其他的目标姿势上去,实现对于衣着等商品的全面展示。
    的头像 发表于 08-02 14:50 2538次阅读

    Facebook的研究人员提出了Mesh R-CNN模型

    研究目标是通过单张图像输入,对图像中的物体进行检测、获取不同物体的类别、掩膜和对应的三维网格,并对真实世界中的复杂模型进行有效处理。在2
    的头像 发表于 08-02 15:51 3874次阅读
    Facebook的<b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    普渡大学的研究人员正在开发一种综合医疗传感平台

    普渡大学的研究人员正在开发一种综合生物传感平台,旨在比现有方法更快,更便宜地检测和监测蚊媒疾病,以帮助预防病毒爆发及其破坏性影响。
    发表于 10-25 09:19 888次阅读

    研究人员出了一种新的基于深度学习的策略

    苏黎世联邦理工学院的研究人员最近推出了一种新的基于深度学习的策略,该策略可以在不需要大量真实数据的情况下在机器人中实现触觉传感。在arXiv上预先发表的篇论文中概述了他们的方法,该方
    的头像 发表于 03-26 15:47 2598次阅读

    研究人员提出了个名为CommPlan的框架

    使用CommPlan,开发人员首先使用数据,领域专业知识和学习算法指定五个模块-任务模型,通信功能,通信成本模型,人员响应模型和人员可选动作
    的头像 发表于 04-09 14:30 2164次阅读

    马来西亚研究人员提出一种评估光伏模块不同冷却系统有效性的新方法

    马来西亚多媒体大学研究人员发表的篇新论文提供了一种评估光伏模块不同冷却系统有效性的新方法。所提出的技术依赖于在附加冷却的情况下测量
    发表于 04-17 15:47 710次阅读

    MIT研究人员提出了一种制造软气动执行器的新方法

    麻省理工学院 (MIT) 的研究人员创造了一种新的制造技术,可以制造出更具成本效益的软气动执行器。
    的头像 发表于 05-06 16:38 1625次阅读
    MIT<b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b><b class='flag-5'>一种</b>制造软气动执行器的新方法