谷歌发表论文EfficientNet 重新思考CNN模型缩放-电子发烧友网

谷歌AI研究部门华人科学家再发论文《EfficientNet：重新思考CNN模型缩放》，模型缩放的传统做法是任意增加CNN的深度和宽度，或使用更大的输入图像分辨率进行训练，而使用EfficientNet使用一组固定额缩放系数统一缩放每个维度，超越了当先最先进图像识别网络的准确率，效率提高了10倍，而且更小。

目前提高CNN精度的方法，主要是通过任意增加CNN深度或宽度，或使用更大的输入图像分辨率进行训练和评估。

以固定的资源成本开发，然后按比例放大，以便在获得更多资源时实现更好的准确性。例如ResNet可以通过增加层数从ResNet-18扩展到ResNet-200。

再比如开源大规模神经网络模型高效训练库GPipe，通过将基线CNN扩展四倍来实现84.3％ ImageNet top-1精度。

这种方法的优势在于确实可以提高精度，但劣势也很明显。这个时候往往需要进行繁琐的微调。一点点的摸黑去试、还经常的徒劳无功。这绝对不是一件能够让人身心愉快的事情，对于谷歌科学家们也一样。

这就是为什么，谷歌人工智能研究部门的科学家们正在研究一种新的“更结构化”的方式，来“扩展”卷积神经网络。他们给这个新的网络命名为：EfficientNet（效率网络）。

代码已开源，论文刚刚上线arXiv，并将在6月11日，作为poster亮相ICML 2019。

比现有卷积网络小84倍，比GPipe快6.1倍

为了理解扩展网络的效果，谷歌的科学家系统地研究了缩放模型不同维度的影响。模型缩放并确定仔细平衡网络深度后，发现只要对网络的深度、宽度和分辨率进行合理地平衡，就能带来更好的性能。基于这一观察，科学家提出了一种新的缩放方法，使用简单但高效的复合系数均匀地缩放深度、宽度和分辨率的所有尺寸。

据悉，EfficientNet-B7在ImageNet上实现了最先进精度的84.4％ Top 1/97.1％ Top 5，同时比最好的现有ConvNet小84倍，推理速度快6.1倍；在CIFAR-100（91.7％），Flower（98.8％）和其他3个迁移学习数据集上，也能很好地传输和实现最先进的精度。参数减少一个数量级，效率却提高了10倍（更小，更快）。

与流行的ResNet-50相比，另一款EfficientNet-B4使用了类似的FLOPS，同时将ResNet-50的最高精度从76.3％提高到82.6％。

这么优秀的成绩是如何做到的

这种复合缩放方法的第一步是执行网格搜索，在固定资源约束下找到基线网络的不同缩放维度之间的关系（例如，2倍FLOPS），这样做的目的是为了找出每个维度的适当缩放系数。然后应用这些系数，将基线网络扩展到所需的目标模型大小或算力预算。

与传统的缩放方法相比，这种复合缩放方法可以持续提高扩展模型的准确性和效率，和传统方法对比结果：MobileNet（+ 1.4％ imagenet精度），ResNet（+ 0.7％）。

新模型缩放的有效性，很大程度上也依赖基线网络。

为了进一步提高性能，研究团队还通过使用AutoML MNAS框架执行神经架构搜索来开发新的基线网络，该框架优化了准确性和效率（FLOPS）。

由此产生的架构使用移动倒置瓶颈卷积（MBConv），类似于MobileNetV2和MnasNet，但由于FLOP预算增加而略大。然后，通过扩展基线网络以获得一系列模型，被称为EfficientNets。

不仅局限于ImageNet

EfficientNets在ImageNet上的良好表现，让谷歌的科学家希望将其应用于更广泛的网络中，造福更多的人。

在8个广泛使用的迁移学习数据集上测试之后，EfficientNet在其中的5个网络实现了最先进的精度。例如，在参数减少21倍的情况下，实现了CIFAR-100（91.7％）和Flowers（98.8％）。

看到这样的结果，谷歌科学家预计EfficientNet可能成为未来计算机视觉任务的新基础，因此将EfficientNet开源。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6211

浏览量
106438
AI

AI

+关注

关注
87

文章
32329

浏览量
271430
cnn

cnn

+关注

关注
3

文章
353

浏览量
22428

原文标题：谷歌出品EfficientNet：比现有卷积网络小84倍，比GPipe快6.1倍

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

无法转换TF OD API掩码RPGA模型怎么办？

无法转换重新训练的 TF OD API 掩码 RPGA 模型，该模型使用以下命令在 GPU 上工作： mo > --saved_model_dir

发表于 03-06 06:44

ai大模型训练方法有哪些？

AI大模型训练方法是一个复杂且不断发展的领域。以下是ai大模型训练方法：数据预处理和增强数据清洗：去除噪声和不完整的数据。数据标准化：将数据缩放到统一的范围。数据增强：通过旋转、缩放

发表于 07-16 10:11 •2341次阅读

cnn常用的几个模型有哪些

CNN（卷积神经网络）是一种深度学习模型，广泛应用于图像识别、自然语言处理等领域。以下是一些常用的CNN模型： LeNet-5：LeNet-5是最早的卷积神经网络之一，由Yann Le

发表于 07-11 14:58 •1204次阅读

图像分割与语义分割中的CNN模型综述

图像分割与语义分割是计算机视觉领域的重要任务，旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络（CNN）作为深度学习的一种核心模型，在图像分割与语义分割中发挥着至关重要的作用。本文将从CNN

发表于 07-09 11:51 •1318次阅读

CNN与RNN的关系

在深度学习的广阔领域中，卷积神经网络（CNN）和循环神经网络（RNN）是两种极为重要且各具特色的神经网络模型。它们各自在图像处理、自然语言处理等领域展现出卓越的性能。本文将从概念、原理、应用场景及代码示例等方面详细探讨CNN与R

发表于 07-08 16:56 •1070次阅读

CNN的定义和优势

CNN是模型还是算法的问题，实际上它兼具了两者的特性，但更侧重于作为一种模型存在。本文将从CNN的定义、结构、原理、应用等多个方面进行深入探讨，旨在全面解析

发表于 07-05 17:37 •4575次阅读

如何在TensorFlow中构建并训练CNN模型

在TensorFlow中构建并训练一个卷积神经网络（CNN）模型是一个涉及多个步骤的过程，包括数据预处理、模型设计、编译、训练以及评估。下面，我将详细阐述这些步骤，并附上一个完整的代码示例。

发表于 07-04 11:47 •1180次阅读

NLP模型中RNN与CNN的选择

在自然语言处理（NLP）领域，循环神经网络（RNN）与卷积神经网络（CNN）是两种极为重要且广泛应用的网络结构。它们各自具有独特的优势，适用于处理不同类型的NLP任务。本文旨在深入探讨RNN与CNN

发表于 07-03 15:59 •714次阅读

cnn卷积神经网络分类有哪些

卷积神经网络（CNN）是一种深度学习模型，广泛应用于图像分类、目标检测、语义分割等领域。本文将详细介绍CNN在分类任务中的应用，包括基本结构、关键技术、常见网络架构以及实际应用案例。引言 1.1

发表于 07-03 09:28 •856次阅读

cnn卷积神经网络三大特点是什么

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。CNN具有以下三大特点：局部连接

发表于 07-03 09:26 •1649次阅读

CNN模型的基本原理、结构、训练过程及应用领域

卷积神经网络（Convolutional Neural Network，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。CNN模型的核心是卷积层

发表于 07-02 15:26 •4452次阅读

卷积神经网络cnn模型有哪些

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。 CNN的基本概念 1.1 卷积层

发表于 07-02 15:24 •884次阅读

深度神经网络模型cnn的基本概念、结构及原理

深度神经网络模型CNN（Convolutional Neural Network）是一种广泛应用于图像识别、视频分析和自然语言处理等领域的深度学习模型。引言深度学习是近年来人工智能领域的研究热点

发表于 07-02 10:11 •1w次阅读

谷歌发布新型大语言模型Gemma 2

在人工智能领域，大语言模型一直是研究的热点。近日，全球科技巨头谷歌宣布，面向全球研究人员和开发人员，正式发布了其最新研发的大语言模型——Gemma 2。这款模型以其高效能和低成本的特点

发表于 06-29 09:48 •550次阅读

STM CUBE AI错误导入onnx模型报错的原因？

使用cube-AI分析模型时报错，该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.ai v8.0.0-19389) INTER

发表于 05-27 07:15

搜索历史

谷歌发表论文EfficientNet 重新思考CNN模型缩放

评论

无法转换TF OD API掩码RPGA模型怎么办？

ai大模型训练方法有哪些？

cnn常用的几个模型有哪些

图像分割与语义分割中的CNN模型综述

CNN与RNN的关系

CNN的定义和优势

如何在TensorFlow中构建并训练CNN模型

NLP模型中RNN与CNN的选择

cnn卷积神经网络分类有哪些

cnn卷积神经网络三大特点是什么

CNN模型的基本原理、结构、训练过程及应用领域

卷积神经网络cnn模型有哪些

深度神经网络模型cnn的基本概念、结构及原理

谷歌发布新型大语言模型Gemma 2

STM CUBE AI错误导入onnx模型报错的原因？