0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

复合模型扩展:一种更好的扩展CNN的方法

WpOh_rgznai100 来源:lq 2019-07-18 15:47 次阅读

开发一个卷积神经网络(CNN)的成本通常是固定的。在获得更多资源时,我们通常会按比例进行扩展,以便获得更优的准确性。例如,ResNet可以通过增加层数从ResNet-18扩展到ResNet-200,最近,GPipe 网络通过将基准 CNN 模型扩展四倍,在 ImageNet Top-1 上获得了 84.3% 的准确度。在模型扩展方面的操作通常是任意增加 CNN 的深度或宽度,或者在更大输入图像分辨率上进行训练和评估。虽然这些方法确实提高模型了准确性,但它们通常需要繁琐的手工调整,而且还不一定能找到最优的结构。换言之,我们是否能找到一种扩展设计方法来获得更好的准确性和效率呢?

在 Google 的 ICML 2019 论文“EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”中,作者提出了一种新的模型尺度缩放方法,该方法使用简单且高效的复合系数以更结构化的方式来扩展 CNN。 与任意缩放网络尺寸的传统方法(例如宽度、深度和分辨率)不同,本文使用一个固定的缩放系数集合,均匀地缩放每个维度。 借助这种新的缩放方法和在AutoML 方面的最新进展,Google 开发了一系列称为 EfficientNets 的模型,它超越了 SOTA 的精度,并且将效率提高了10倍(更小、更快)。

复合模型扩展:一种更好的扩展 CNN 的方法

为了理解扩展网络的效果,本文系统地研究了扩展模型不同维度带来的影响。虽然扩展各个维度可以提高模型性能,但作者观察到,平衡网络宽度、深度和输入图像大小这些维度比增加计算资源,可以更好地提高整体性能。

复合扩展方法的第一步是执行网格搜索,用来找到在固定资源下基准网络不同扩展维度之间的关系。这决定了上文提到的每个维度的缩放系数。然后,作者用这些系数将基准网络扩展到所需的目标模型大小或预算的计算力。

不同缩放方法的比较。 与传统仅缩放单个维度的方法(b)-(d)不同,我们的复合缩放方法以某种方式统一扩展所有维度。

与传统的缩放方法相比,这种复合缩放方法可以用于提高多个模型的准确性和效率,如MobileNet(+ 1.4%图像网精度)和ResNet(+ 0.7%)。

高效的网络架构

模型缩放的有效性也在很大程度上依赖于基准网络。 因此,为了进一步提高性能,作者使用了 AutoML MNAS 框架(该框架在准确性和效率上都做了优化),利用神经架构搜索来开发新的基准网络。 由此产生的架构使用了移动端的逆向 bottleneck 卷积(MBConv),类似于 MobileNetV2 和 MnasNet,但由于有更多的 FLOP 预算,因此结构略大。最终,作者扩展了这个基准网络以获得一系列模型,称为 EfficientNets。

本文的基准网络 EfficientNet-B0,其架构简单干净,便于扩展。

EfficientNet 网络的性能

文中将 EfficientNets 与 ImageNet 上其他现有的 CNN 进行了比较。 总的来说,EfficientNet 模型实现了比现有 CNN 更高的精度和更高的效率,将参数大小和 FLOPS 降低了一个数量级。 例如,在高精度下,EfficientNet-B7 在 ImageNet 上达到了 SOTA 的Top-1,84.4% 的准确率与 Top-5 97.1% 的准确率,同时在 CPU 上的开销比之前的 Gpipe 小 8.4 倍和 6.1 倍。与广泛使用的 ResNet-50 相比,EfficientNet-B4 在保持相同 FLOPS 开销情况下,将 Top-1 的精度从ResNet-50 的 76.3% 提高到 82.6%(+ 6.3%)。

模型尺寸与精度比较。 EfficientNet-B0 是由 AutoML MNAS 开发的基准网络,而 Efficient-B1 到 B7 是通过扩展基准网络得到。特别是,EfficientNet-B7 实现了 SOTA 的 Top-1,84.4% 准确率与 Top-5,97.1% 的准确率,同时比现有最佳的 CNN 小 8.4 倍。

尽管 EfficientNets 在 ImageNet 上表现较好,但为了验证它的泛化能力,也应该在其他数据集上进行测试。 为了评估这一点,作者在八个广泛使用的迁移学习数据集上测试了EfficientNets。EfficientNets 在 8 个数据集中的 5 个中实现了 SOTA 的精度,例如 CIFAR-100(91.7%)和 Flowers(98.8%),模型参数减少了一个数量级(减少了21倍),这表明EfficientNets 也能很好的进行迁移。

由于 EfficientNets 显著提高了模型效率,作者预计它可能在未来会成为计算机视觉任务的新基础。 因此,作者开源了所有 EfficientNet 模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10794

    浏览量

    210664
  • 神经网络
    +关注

    关注

    42

    文章

    4732

    浏览量

    100374
  • cnn
    cnn
    +关注

    关注

    3

    文章

    350

    浏览量

    22115

原文标题:谷歌开源新模型EfficientNet,或成计算机视觉任务新基础

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    请问这两机械手模型哪种实验性能更好,可扩展更好

    `我打算买个六轴机械手模型用来验证自动运行算法,但不知道从机械角度上来来说哪种实验性能更好,可扩展更好,这两都是数字舵机带动的。麻烦给出
    发表于 07-15 17:00

    一种高分辨力角位移传感器量程扩展方法

    提出一种采用多探测光路的角位移量程扩展方案, 可以在不降低分辨力的条件下, 将量程扩展多倍, 使传感器同时具有高分辨力、大量程的优点。结果表明, 量程扩展到360" , 两光路的
    发表于 07-14 08:40 20次下载

    一种新型可扩展的多级多平面分组交换结构的图论模型与性能分析

    该文提出了一种新型可扩展的多级多平面(MPMS)分组交换结构。首先建立了MPMS 的图论模型,定量地描述了MPMS 中相邻连通性和端口可达性,定义了MPMS 的均衡顶点和竞争顶点,并证明
    发表于 11-18 15:34 16次下载

    一种复合故障预测动态建模方法

    本文提出一种复合故障预测动态建模方法,将原有故障数据样本经过参数相关性分析,按特征输入支持向量回归机建立相应的故障预测模型,可以很有效预测未来较长时间的数据
    发表于 12-14 11:58 16次下载

    一种改进的基于伪相关反馈的查询扩展

    在分析当前信息检索存在问题的基础上,以及简单介绍现有相关反馈和伪相关反馈的优缺点基础上,提出一种新的首页相关反馈的查询扩展方法,并引入网页特有的特征项给出
    发表于 12-29 17:05 10次下载

    用纯软件扩展单片机串行口的一种方法

    摘要:本文介绍一种用纯软件来扩展89C51单片机串行口的方法,详细说明了通过扫描发送、中断接收实现模拟串行通信的编程技巧。关键词:串行口;通信;89C51;单片机;扩展
    发表于 07-15 12:25 33次下载

    系统中多普勒频移容限扩展一种方法

    提出了一种扩展2FSK扩频通信系统的多普勒频移容限的方法,即适当缩短相关累加时间,伪码捕获和数据解调时采用相关累加与非相关累加相结合的方法。该方法
    发表于 05-08 16:01 14次下载
    系统中多普勒频移容限<b class='flag-5'>扩展</b>的<b class='flag-5'>一种方法</b>

    一种嵌入式手持设备的无线数据通信模块扩展方法

    文中针对类嵌入式手持设备提出了一种扩展低成本无线数据通信模块的方法。通过对基于ARM技术的嵌入式手持设备样机的研究详细地介绍无线数据通信模块的扩展
    发表于 04-18 14:12 6次下载

    一种基于DSP的多核SOC中断扩展设计与实现

    一种基于DSP的多核SOC中断扩展设计与实现_张跃玲
    发表于 01-07 21:08 0次下载

    一种扩展的基于角色的访问控制ERBAC模型

    提出一种扩展的基于角色的访问控制ERBAC模型,以解决RBAC在多域云系统的资源使用约束、策略管理和互操作安全性等方面存在的不足。首先,通过引入容器元素和两类角色基数约束,构建了基于容器元素十动态
    发表于 11-21 16:44 15次下载
    <b class='flag-5'>一种</b><b class='flag-5'>扩展</b>的基于角色的访问控制ERBAC<b class='flag-5'>模型</b>

    语音带宽扩展的激励分段扩展方法

    语音带宽扩展通过人为恢复窄带语音的频谱带宽来提高语音听觉质量。针对源滤波器扩展模型的激励扩展问题,提出一种分段
    发表于 11-29 16:29 0次下载
    语音带宽<b class='flag-5'>扩展</b>的激励分段<b class='flag-5'>扩展</b><b class='flag-5'>方法</b>

    基于语义向量表示的查询扩展方法的应用设计

    针对传统查询扩展方法在专业领域中扩展词与原始查询之间缺乏语义关联的问题,提出一种基于语义向量表示的查询扩展
    发表于 12-12 16:11 0次下载

    一种利用强化学习来设计mobile CNN模型的自动神经结构搜索方法

    具体来说,我们提出一种用于设计移动端的CNN模型的自动神经结构搜索方法,称之为Platform-Aware神经结构搜索。图1是Platform-Aware神经结构搜索
    的头像 发表于 08-07 14:10 3793次阅读

    基于扩展状态空间模型扩展非最小状态空间模型方法电子书免费下载

    约束优化方法;(3)提出了基于改进遗传算法的MPC;(4)给出了相应的工业应用实例。MPC作为一种很有前途的控制算法,在工业过程控制中起着至关重要的作用。近几十年来,在理论和应用方面都取得了很大的进展。在经济快速发展和更高要求的推动下,提
    发表于 04-26 08:00 0次下载
    基于<b class='flag-5'>扩展</b>状态空间<b class='flag-5'>模型</b>和<b class='flag-5'>扩展</b>非最小状态空间<b class='flag-5'>模型</b>的<b class='flag-5'>方法</b>电子书免费下载

    结合基扩展模型和深度学习的信道估计方法

    结合基扩展模型和深度学习的信道估计方法
    发表于 06-30 10:43 62次下载