谷歌AI新方法可提升10倍图像识别效率关键还简单易用-电子发烧友网

在开发以卷积神经网络（CNN）为核心的机器学习模型时，我们通常会先使用固定的资源成本，构建最初的模型，然后增加更多资源（层数）扩展模型，从而获得更高的准确率。

著名的 CNN 模型 ResNet（深度残差网络），就可以用增加层数的方法从ResNet-18 扩展到 ResNet-200。谷歌的 GPipe 模型也通过将基线 CNN 扩展 4 倍，在 ImageNet 数据库上达到84.3% 的准确率，力压所有模型。

一般来说，模型的扩大和缩小都是任意增加 CNN 的深度或宽度，抑或是使用分辨率更大的图像进行训练和评估。虽然这些传统方法提高准确率的效果不错，但大多需要繁琐的手动调整，还可能无法达到最佳性能。

因此，谷歌AI团队最近提出了新的模型缩放方法“复合缩放（CompoundScaling）”和配套的EfficientNet 模型。他们使用复合系数和 AutoML 从多个维度均衡缩放 CNN，综合考虑深度和宽度等参数，而不是只单纯地考虑一个，使得模型的准确率和效率大幅提升，图像识别的效率甚至可以大幅提升 10 倍。

这项新方法的根本优势在于实践起来非常简单，背后的原理很好理解，甚至让人怀疑为什么没有被更早发现。该研究成果以论文的形式被 ICML2019（国际机器学习大会）接收，名为 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。EfficientNet 模型的相关代码和 TPU 训练数据也已经在 GitHub 上开源。

寻找复合系数

为了弄清楚神经网络缩放之后的效果，谷歌团队系统地研究了改变不同维度对模型的影响，维度参数包括网络深度、宽度和图像分辨率。

首先他们进行了栅格搜索（GridSearch）。这是一种穷举搜索方法，可以在固定资源的限定下，列出所有参数之间的关系，显示出改变某一种维度时，基线网络模型会受到什么样的影响。换句话说，如果只改变了宽度、深度或分辨率，模型的表现会发生什么变化。

图 |以基线网络为基础，列出所有维度变化对模型的影响

综合考虑所有情况之后，他们确定了每个维度最合适的调整系数，然后将它们一同应用到基线网络中，对每个维度都进行适当的缩放，并且确保其符合目标模型的大小和计算预算。

简单来说，就是分别找到宽度、深度和分辨率的最佳系数，然后将它们组合起来一起放入原本的网络模型中，对每一个维度都有所调整。从整体的角度缩放模型。

与传统方法相比，这种复合缩放法可以持续提高模型的准确性和效率。在现有模型 MobileNet 和 ResNet 上的测试结果显示，它分别提高了 1.4% 和 0.7% 的准确率。

高效的网络架构和性能

缩放模型的有效性也依赖于基线网络（架构）本身。

因为，为了进一步提高性能，谷歌 AI 团队还使用了 AutoMLMNAS 框架进行神经架构搜索，优化准确性和效率。AutoML 是一种可以自动设计神经网络的技术，由谷歌团队在 2017 年提出，而且经过了多次优化更新。使用这种技术可以更简便地创造神经网络。

由此产生的架构使用了移动倒置瓶颈卷积（MBConv），类似于 MobileNetV2 和 MnasNet 模型，但由于计算力（FLOPS）预算增加，MBConv 模型体积略大。随后他们多次缩放了基线网络，组成了一系列模型，统称为EfficientNets。

图 |EfficientNet-B0 基线网络架构

为了测试其性能，研究人员与 ImageNet 上的其他现有 CNN 进行了比较。结果显示，EfficientNet 在大多数情况下表现亮眼，比现有 CNN 的准确率和效率都高，还将参数大小和计算力降低了一个数量级。

比如 EfficientNet-B7 在 ImageNet 上达到的 Top-1 最高准确率是 84.4%，Top-5 准确率是 97.1%。在 CPU 推理上，它的体积比最好的 CNN 模型 GPipe 小 8.4 倍，但速度快了 6.1 倍。与广泛使用的 ResNet-50 相比，EfficientNet-B4 使用了类似的计算力，但 Top-1 准确率从 76.3% 提升到了 82.6%。

图 |参数使用量和 ImageNetTop-1 准确率对比

此外，EfficientNets 不仅在 ImageNet 上表现出众，其能力还可以转移到其它数据集上。

他们在 8 个流行的迁移学习数据集上测试了 EfficientNets。结果显示，它在其中的 5 个上面都拿到了顶尖成绩，例如在 CIFAR-100 上获得了 91.7％的成绩，在 Flowers 上获得了 98.8％的成绩，而且参数至少减少了一个数量级，甚至还可以最多减少 21 倍，说明 EfficientNets 具有很强的迁移能力。

谷歌 AI 团队认为，EfficientNets 有望凭借简单易操作的特点，成为未来计算机视觉任务的新基石。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6143

浏览量
105163
图像识别

图像识别

+关注

关注
9

文章
519

浏览量
38245
AI

AI

+关注

关注
87

文章
30315

浏览量
268571

原文标题：谷歌 AI 新方法：可提升 10 倍图像识别效率，关键还简单易用

文章出处：【微信号：deeptechchina，微信公众号：deeptechchina】欢迎添加关注！文章转载请注明出处。

AI图像识别摄像机

随着科技的迅猛发展，人工智能（AI）在各个领域的应用越来越广泛，其中图像识别技术尤为引人注目。AI图像识别摄像机作为这一技术的重要应用之一，正在逐步改变我们的生活和工作方式。什么是

发表于 11-08 10:38 •180次阅读

<b class='flag-5'>AI</b><b class='flag-5'>图像识别</b>摄像机

AI大模型在图像识别中的优势

大模型借助高性能的计算硬件和优化的算法，能够在短时间内完成对大量图像数据的处理和分析，显著提高了图像识别的效率。识别准确性：通过深度学习和计算机视觉技术，

发表于 10-23 15:01 •431次阅读

图像识别算法有哪几种

计算机科学家开始尝试使用计算机来处理和分析图像数据。最初的图像识别算法主要基于模板匹配和边缘检测等简单方法，但随着计算机硬件和算法的不断发展，图像识别算法逐渐变得更加复杂和高效。 20

发表于 07-16 11:22 •971次阅读

图像检测和图像识别的原理、方法及应用场景

图像检测和图像识别是计算机视觉领域的两个重要概念，它们在许多应用场景中发挥着关键作用。 1. 定义 1.1 图像检测图像检测（Object

发表于 07-16 11:19 •3469次阅读

图像识别算法都有哪些方法

图像识别算法是计算机视觉领域的核心任务之一，它涉及到从图像中提取特征并进行分类、识别和分析的过程。随着深度学习技术的不断发展，图像识别算法已经取得了显著的进展。本文将介绍

发表于 07-16 11:14 •5209次阅读

图像识别算法的提升有哪些

引言 图像识别是计算机视觉领域的核心任务之一，旨在使计算机能够自动地识别和理解图像中的内容。随着计算机硬件的发展和深度学习技术的突破，图像识别算法的性能得到了显著

发表于 07-16 11:12 •604次阅读

图像识别算法的优缺点有哪些

：图像识别算法可以快速地处理大量图像数据，提高工作效率。与传统的人工识别方法相比，图像识别算法可以在短时间内完成对大量

发表于 07-16 11:09 •1394次阅读

图像识别算法的核心技术是什么

图像识别算法是计算机视觉领域的一个重要研究方向，其目标是使计算机能够像人类一样理解和识别图像中的内容。图像识别算法的核心技术包括以下几个方面：特征提取特征提取是

发表于 07-16 11:02 •585次阅读

图像识别技术的原理是什么

图像识别技术是一种利用计算机视觉和机器学习技术对图像进行分析和理解的技术。它可以帮助计算机识别和理解图像中的对象、场景和活动。图像预处理

发表于 07-16 10:46 •846次阅读

图像识别属于人工智能吗

属于。图像识别是人工智能（Artificial Intelligence, AI）领域的一个重要分支。一、图像识别概述 1.1 定义 图像识别是指利用计算机技术对

发表于 07-16 10:44 •993次阅读

opencv图像识别有什么算法

图像识别算法：边缘检测：边缘检测是图像识别中的基本步骤之一，用于识别图像中的边缘。常见的边缘检测算法有Canny边缘检测器、Sobel边缘检测器和Laplacian边缘检测器。特

发表于 07-16 10:40 •890次阅读

如何利用CNN实现图像识别

卷积神经网络（CNN）是深度学习领域中一种特别适用于图像识别任务的神经网络结构。它通过模拟人类视觉系统的处理方式，利用卷积、池化等操作，自动提取图像中的特征，进而实现高效的图像识别。本文将从CNN的基本原理、构建过程、训练策略以

发表于 07-03 16:16 •1206次阅读

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型开发效率提升10倍

的潞晨科技Colossal-AI系统，用户可实现在本地算力平台一键训练、微调、推理、部署大模型，将大模型开发效率提升10

发表于 03-01 09:43 •460次阅读

潞晨科技Colossal-<b class='flag-5'>AI</b> + 浪潮信息AIStation，大模型开发<b class='flag-5'>效率</b><b class='flag-5'>提升</b><b class='flag-5'>10</b><b class='flag-5'>倍</b>

图像识别技术原理图像识别技术的应用领域

图像识别技术是一种通过计算机对图像进行分析和理解的技术。它借助计算机视觉、模式识别、人工智能等相关技术，通过对图像进行特征提取和匹配，找出图像

发表于 02-02 11:01 •2305次阅读

如何使用Python进行图像识别的自动学习自动训练？

如何使用Python进行图像识别的自动学习自动训练？使用Python进行图像识别的自动学习和自动训练需要掌握一些重要的概念和技术。在本文中，我们将介绍如何使用Python中的一些常用库和算法来实现

发表于 01-12 16:06 •552次阅读

搜索历史

谷歌AI新方法可提升10倍图像识别效率关键还简单易用

评论