卷积网络最新研究:通过AutoML和模型规模化提升精度与效率-电子发烧友网

卷积网络的部署通常在固定资源的情况下进行，如果想要提高精度就需要更多的资源来部署更大、更深的网络。实际应用中，人们可以把ResNet-18拓展到ResNet-200增加层数提高精度，谷歌近期提出的GPipe也利用提升规模的方法在ImageNet上实现了84.3%的top-1精度。

Gpipe模型与ResNet不同规模的模型

对于扩大模型的规模，通常的做法是增加卷积网络的深度或宽度，或者利用更大的输入分辨率来训练和测评。虽然能够大幅度提升精度，但需要复杂的手工调校来进行优化。

那么我们能不能找到一种更为通用的方法来使扩大CNNs的规模以得到更好的精度和速度呢？谷歌在今年的ICML会议上给出了一种可行的解决方案。研究中提出了一种名为EfficientNet，通过简单高效地混合系数来结构化地扩大CNNs的规模。与先前提高网络维度参数不同，这种新的方法不会去调整宽度、深度和分辨率，而是利用固定的规模系数集均匀化地对每个维度进行扩增。

基于这种规模化方法和自动机器学习，研究人员开发出了新的网络家族EfficientNets，不仅在精度上超过了前辈，更在效率上有了10倍的提升。

混合模型规模化—扩大CNNs规模的好方法

研究人员首先系统地分析了不同维度上的规模化对于模型的影响。

在深度、宽度和分辨率等维度上记性扩充后的模型效果提升，但单个维度在达到80%后很快趋近于饱和。

分别对于不同的维度进行规模化后，研究人员发现对于网络宽度、深度和图像分辨率等所有维度的平衡下对于模型的表现提升最好。所以混合而不是单一的改变模型的规模是提升性能的较好选择。混合规模化方法的第一步是进行栅格搜索，在固定资源限制的条件下寻找不同规模维度下的关系。这将为不同的维度寻找适宜的规模化系数来实现最好的效果。随后利用这些搜索到的系数来对基准网络进行扩充，在给定的计算资源和模型大小下实现目标模型。

上图显示了不同规模化的方法，与先前的方法不同，新提出的混合规模化方法在所有的维度上进行了规模化提升。

实验表明这种混合规模化方法比mobileNet(+1.4%)和ResNet(+0.7%)都有提升。

EfficientNet架构

前述的模型在规模化的时候依然高度依赖于基础网络模型。所以为了更好的提高模型的表现，研究人员提出了新型基准网络模型。利用自动机器学习框架来进行神经架构搜索，同时优化了精度和效率(FLOPS)。

最终的架构类似MobileNetV2和MnasNet，使用了移动反转瓶颈卷积结构(mobile inverted bottleneck)，但在规模上有些许扩大。基于这一基础网络，研究人员利用不同的扩充方式得到了规模化的网络家族EfficientNets。

简单的基准模型更容易扩展和规模化

EfficientNet的表现

为了测试模型的性能，研究人员在ImageNet上对现有的先进模型与EfficientNet进行了比较，结果表明EfficientNet在精度和效率上都超过了现有的模型，甚至在相同精度下将模型参数和操作减小了一个数量级。

在下图中可以看到，在左上角的高精度区域，B7型EfficientNet在ImageNet上达到了84.4%的top-1精度和97.1%的top-5精度，但与先前的GPipe相比在CPU上的运行使用的参数减小了8.4倍同时速度提升了6.1倍。与广泛使用的ResNet-50相比，相同参数的情况下提升了6.3%的top-1精度。

结果显示了新的模型家族在精度与效率上的优势。

此外，为了验证模型的其他数据集上的表现，研究人员还将模型迁移到了CIFAR-100和Flowers上，EfficientNet在参数减少一个数量级（21x）的情况下在8个测试数据集中的5个上取得了最好的精度，证明了这一方法具有稳定的泛化能力。这种新的模型有望成为计算机视觉任务的新基准，研究人员开源了所有的代码，同时可以看在这里找到基于TPU的加速实现

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6211

浏览量
106373
卷积网络

卷积网络

+关注

关注
0

文章
42

浏览量
2246

原文标题：谷歌最新研究EfficientNet，通过AutoML和模型规模化提升精度与效率

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

AI模型部署边缘设备的奇妙之旅：目标检测模型

的是百度的Picodet模型，它是一种基于深度卷积网络（DNN）的轻量级目标检测模型，具有非常高的检测精度，可以在低算力设备进行实时的端到端

发表于 12-19 14:33

卷积神经网络共包括哪些层级

卷积神经网络（Convolutional Neural Network, CNN）是一种深度学习模型，广泛应用于图像识别、语音识别、自然语言处理等领域。它以卷积层为核心，

发表于 07-11 15:58 •1592次阅读

经典卷积网络模型介绍

经典卷积网络模型在深度学习领域，尤其是在计算机视觉任务中，扮演着举足轻重的角色。这些模型通过不断演进和创新，推动了图像处理、目标检测、图像生

发表于 07-11 11:45 •719次阅读

卷积神经网络中池化层的作用

在深度学习领域，卷积神经网络（Convolutional Neural Network, CNN）以其卓越的图像处理和计算机视觉能力而广受欢迎。CNN由多个层组成，其中包括卷积层、池化

发表于 07-03 15:58 •2136次阅读

卷积神经网络实现示例

卷积神经网络（Convolutional Neural Network，简称CNN）是一种深度学习模型，主要用于处理具有网格结构的数据，如图像。CNN通过

发表于 07-03 10:51 •550次阅读

卷积神经网络分类方法有哪些

，包括基本原理、常见架构、优化策略、应用场景等。 1. 卷积神经网络的基本原理卷积神经网络是一种前馈神经网络，其核心思想是

发表于 07-03 09:40 •607次阅读

cnn卷积神经网络分类有哪些

卷积神经网络概述卷积神经网络（Convolutional Neural Network，简称CNN）是一种深度学习模型，由多层

发表于 07-03 09:28 •839次阅读

卷积神经网络可以通过输出反推到输入吗

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。CNN通过

发表于 07-03 09:17 •850次阅读

卷积神经网络训练的是什么

、训练过程以及应用场景。 1. 卷积神经网络的基本概念 1.1 卷积神经网络的定义卷积神经网络

发表于 07-03 09:15 •600次阅读

卷积神经网络的原理与实现

核心思想是通过卷积操作提取输入数据的特征。与传统的神经网络不同，卷积神经网络具有参数共享和局部连接的特点，这使得其在处理图像等高维数据时具有

发表于 07-02 16:47 •809次阅读

卷积神经网络cnn模型有哪些

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。 CNN的基本概念 1.1 卷积

发表于 07-02 15:24 •876次阅读

卷积神经网络的基本结构及其功能

。引言深度学习是机器学习的一个分支，它通过模拟人脑神经网络的结构和功能，实现对数据的自动学习和特征提取。卷积神经网络是深度学习中的一种重要模型

发表于 07-02 14:45 •2657次阅读

卷积神经网络的原理是什么

基本概念、结构、训练过程以及应用场景。卷积神经网络的基本概念 1.1 神经网络神经网络是一种受人脑神经元结构启发的数学模型，由大量的节点

发表于 07-02 14:44 •878次阅读

【大规模语言模型：从理论到实践】- 阅读体验

注意力机制提高了模型在处理长序列数据时的性能，但在某些任务上，传统的循环神经网络（RNN）或卷积神经网络（CNN）可能仍然具有优势。此外，注意力机制本身也可能存在某些性能瓶颈，需要进一

发表于 06-07 14:44

【大语言模型：原理与工程实践】揭开大语言模型的面纱

Transformer架构，利用自注意力机制对文本进行编码，通过预训练、有监督微调和强化学习等阶段，不断提升性能，展现出强大的语言理解和生成能力。大语言模型的涌现能力，是指随着模型

发表于 05-04 23:55

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

卷积网络最新研究:通过AutoML和模型规模化提升精度与效率

评论