谷歌 | AI再突破,Efficientnets有望成为计算机视觉任务的新基础!-电子发烧友网

谷歌人工智能研究部门的科学家认为Efficientnets通过宽度、深度、分辨率三个维度的复合扩展，展现出比现行的CNN更高的精度和效率，将成为未来计算机视觉任务的新基础。

卷积神经网络（CNN）作为人工神经网络的一种，是当下语音分析和图像识别领域的研究热点。

它的人工神经元可以响应一部分覆盖范围内的周围单元，所以对于大型图像处理有出色表现，但是如果要某一点上提高准确性，就需要进行较为繁琐的优化调整。

针对这一现象，谷歌人工智能研究部门的科学家正在研究一种“更结构化”的方式，用以“缩放”CNN，期望获得更好的精度和效率。

最近，他们在Arxiv.org上发表的一篇论文（EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks）并附带了一篇博客文章中对其进行描述。他们声称，这个被称为“Efficientnets”的AI系统，超过了最先进的精度，并且提升了10倍的效率。

这篇论文的作者工程师Mingxing Tan 和谷歌人工智能首席科学家Quocv.le都来自谷歌大脑。

他们认为，模型缩放的传统做法是任意增加CNN的深度或宽度，或者使用更大的输入图像分辨率进行训练和评估。区别于传统方法，他们采用了一组固定的缩放系数来均匀缩放每个尺寸。

图中最右侧就是他们的方案，在宽度、深度、分辨率三个维度进行复合扩展。单一调整一个维度能够获得精度提升，但是随着参数调的越大，精度增益越平滑，改进将会不明显。而联合调整就能够获得相对更好的精度增益曲线。

那么，它是如何做到的呢？

首先，在固定的资源约束下，通过进行栅栏搜索，识别基线网络不同维度之间的关系。例如，增加两倍的FLOPS。这决定了每一个维度适当的缩放系数，将应用于基线网络缩放至需要的模型尺寸或者计算预算。为了进一步提高性能，科研人员提出了一种新的基线网络，即MBConv，可以为EfficientNets模型体系提供种子。

在测试的过程中，Efficientnets展现出比现行的CNN更高的精度和效率，将参数大小和FLOPS减少了一个数量级。

其中，Efficientnet-B7比CNNgpipe小8.4倍，快6.1倍，分别在imagenet中上达到了Top-1（84.4%）和Top-5（97.1%）的精度。与resnet-50相比，EfficientNet-B4使top-1精度从ResNet-50的76.3%提高至82.6%。

EfficientNets在其他数据集的表现也很好。在5/8的广泛使用的转移学习数据集中，EfficientNets都达到了最先进的精度，并且减少了21个参数。例如，CIFAR-100（91.7％）和Flowers（98.8％），这也表明EfficientNets有很好地转移。

两位作者表示，通过对模型效率的显著改进，EfficientNets有可能成为未来计算机视觉活动的新基础。他们开源了所有EfficientNet模型，希望这些模型可以使机器学习社区受益。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6211

浏览量
106362
AI

AI

+关注

关注
87

文章
32172

浏览量
271189
计算机视觉

计算机视觉

+关注

关注
8

文章
1702

浏览量
46210

原文标题：谷歌AI再突破，Efficientnets有望成为计算机视觉任务的新基础！

文章出处：【微信号：Aiobservation，微信公众号：人工智能观察】欢迎添加关注！文章转载请注明出处。

计算机视觉有哪些优缺点

计算机视觉作为人工智能领域的一个重要分支，旨在使计算机能够像人类一样理解和解释图像和视频中的信息。这一技术的发展不仅推动了多个行业的变革，也带来了诸多优势，但同时也伴随着一些挑战和局限性。以下是对

发表于 08-14 09:49 •1237次阅读

计算机视觉技术的AI算法模型

计算机视觉技术作为人工智能领域的一个重要分支，旨在使计算机能够像人类一样理解和解释图像及视频中的信息。为了实现这一目标，计算机视觉技术依赖于

发表于 07-24 12:46 •1198次阅读

机器视觉和计算机视觉有什么区别

。机器视觉的研究目标是让机器具有类似人类的视觉能力，能够自动、准确地完成各种视觉任务。 计算机视觉

发表于 07-16 10:23 •699次阅读

计算机视觉的五大技术

计算机视觉作为深度学习领域最热门的研究方向之一，其技术涵盖了多个方面，为人工智能的发展开拓了广阔的道路。以下是对计算机视觉五大技术的详细解析，包括图像分类、对象检测、目标跟踪、语义分割

发表于 07-10 18:26 •1713次阅读

计算机视觉的工作原理和应用

计算机视觉（Computer Vision，简称CV）是一门跨学科的研究领域，它利用计算机和数学算法来模拟人类视觉系统对图像和视频进行识别、理解、分析和处理。其核心目标在于使

发表于 07-10 18:24 •2462次阅读

机器人视觉与计算机视觉的区别与联系

机器人视觉与计算机视觉是两个密切相关但又有所区别的领域。 1. 引言在当今科技迅猛发展的时代，机器人和计算机视觉技术在各个领域发挥着越来越

发表于 07-09 09:27 •810次阅读

计算机视觉与人工智能的关系是什么

引言 计算机视觉是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如何使计算

发表于 07-09 09:25 •845次阅读

计算机视觉与智能感知是干嘛的

引言 计算机视觉（Computer Vision）是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域，是人工智能的重要组成部分。智能

发表于 07-09 09:23 •1204次阅读

计算机视觉和机器视觉区别在哪

计算机视觉和机器视觉是两个密切相关但又有明显区别的领域。一、定义 计算机视觉 计算机

发表于 07-09 09:22 •579次阅读

计算机视觉和图像处理的区别和联系

计算机视觉和图像处理是两个密切相关但又有明显区别的领域。 1. 基本概念 1.1 计算机视觉 计算机视觉

发表于 07-09 09:16 •1623次阅读

计算机视觉属于人工智能吗

属于，计算机视觉是人工智能领域的一个重要分支。引言 计算机视觉是一门研究如何使计算机具有视觉能

发表于 07-09 09:11 •1532次阅读

深度学习在计算机视觉领域的应用

深度学习技术的引入，极大地推动了计算机视觉领域的发展，使其能够处理更加复杂和多样化的视觉任务。本文将详细介绍深度学习在计算机

发表于 07-01 11:38 •1107次阅读

机器视觉与计算机视觉的区别

在人工智能和自动化技术的快速发展中，机器视觉（Machine Vision, MV）和计算机视觉（Computer Vision, CV）作为两个重要的分支领域，都扮演着至关重要的角色。尽管它们在

发表于 06-06 17:24 •1581次阅读

计算机视觉的主要研究方向

计算机视觉（Computer Vision, CV）作为人工智能领域的一个重要分支，致力于使计算机能够像人眼一样理解和解释图像和视频中的信息。随着深度学习、大数据等技术的快速发展，计算机

发表于 06-06 17:17 •1290次阅读

工业计算机与普通计算机的区别

在信息化和自动化日益发展的今天，计算机已经成为了我们日常生活和工作中不可或缺的工具。然而，在计算机领域中，工业计算机和普通计算机虽然都具备基

发表于 06-06 16:45 •1764次阅读

搜索历史

谷歌 | AI再突破,Efficientnets有望成为计算机视觉任务的新基础!

评论

计算机视觉有哪些优缺点

计算机视觉技术的AI算法模型

机器视觉和计算机视觉有什么区别

计算机视觉的五大技术

计算机视觉的工作原理和应用

机器人视觉与计算机视觉的区别与联系

计算机视觉与人工智能的关系是什么

计算机视觉与智能感知是干嘛的

计算机视觉和机器视觉区别在哪

计算机视觉和图像处理的区别和联系

计算机视觉属于人工智能吗

深度学习在计算机视觉领域的应用

机器视觉与计算机视觉的区别

计算机视觉的主要研究方向

工业计算机与普通计算机的区别