数据增强过程是否也可以实现自动化？-电子发烧友网

计算机视觉深度学习的成功部分归功于拥有大量带标记的训练数据，因为模型的性能通常会随着训练数据质量、多样性和数量的增加而相应提高。然而，要收集足够多的高质量数据来训练模型以使其具有良好的性能，往往非常困难。要解决这一问题，一种方法是将图像对称性硬编码到神经网络架构中来提高性能，另一种是由专家手动设计训练高性能视觉模型常用的数据增强方法，如旋转和翻转。不过，直到最近，人们还很少关注如何利用机器学习来自动增强现有数据。我们此前推出了 AutoML，代替人为设计的系统组件，自动设计神经网络架构和优化器，取得了良好效果。受此启发，我们提出新的设想：数据增强过程是否也可以实现自动化？

在 “AutoAugment:Learning Augmentation Policies from Data” 一文中，我们探索了一种增强学习算法，这种算法增加了现有训练数据集中数据的数量和多样性。直观地说，数据增强用于教会模型有关数据域中的图像不变性，让神经网络对这些重要的对称性保持不变，从而改善其性能。与以往使用手工设计的数据增强策略的先进深度学习模型不同，我们使用增强学习从数据本身寻找最佳图像变换策略，从而在不依赖于生成新的和不断扩展的数据集的情况下，提高了计算机视觉模型的性能。

增强训练数据

数据增强的思路很简单：图像有许多对称性，这些对称性不会改变图像中存在的信息。例如，狗的镜面反射仍然是狗。虽然其中一些“不变性”对人类来说显而易见，但有许多却并非如此。例如，mixup 方法通过在训练期间将图像彼此叠加来增强数据，从而产生可改善神经网络性能的数据。

左图：来自 ImageNet 数据集的原始图像。右图：同一图像通过常用的数据增强变换（围绕中心水平翻转）处理后。

AutoAugment 是为计算机视觉数据集设计自定义数据增强策略的一种自动方式，例如，可指导基本图像变换操作的选择，如水平/垂直翻转图像、旋转图像和更改图像颜色等。AutoAugment 不仅可以预测要组合的图像变换，还可以预测每个图像使用变换的概率和数量，以便确保图像操作并不局限于一种方式。AutoAugment 能够从具有 2.9 x 1032 种图像变换可能性的搜索空间中选出最佳策略。

AutoAugment 根据所运行的数据集学习不同的变换。例如，对于包含数字自然场景图像的门牌号街景 (SVHN) 图像，AutoAugment 侧重于剪切和平移等几何变换，这些操作表示在该数据集中通常观察到的失真。此外，考虑到世界上不同楼号和门牌号材料的多样性，AutoAugment 已经学会完全颠倒原始 SVHN 数据集中自然出现的颜色。

左图：来自 SVHN 数据集的原始图像。右图：同一图像通过 AutoAugment 变换后。在这种情况下，通过剪切图像和反转像素颜色实现最佳变换。

在 CIFAR-10 和 ImageNet 上，AutoAugment 不使用剪切，因为这些数据集通常不包括剪切物体的图像，也不完全反转颜色，因为这些变换会导致图像失真。相反，AutoAugment 侧重于微调颜色和色相分布，同时保留一般颜色属性。这表明 CIFAR-10 和 ImageNet 中物体的实际颜色十分重要，而在 SVHN 上只有相对颜色是重要的。

左图：来自 ImageNet 数据集的原始图像。右图：同一图像通过 AutoAugment 策略变换后。首先最大化图像对比度，然后旋转图像。

成果

我们的 AutoAugment 算法为一些最著名的计算机视觉数据集找到了增强策略，将这些策略纳入神经网络的训练中后，准确性得到了质的提升。通过增强 ImageNet 数据，top1 准确度达到 83.54% 的最新水平，在 CIFAR10 上，我们的错误率为 1.48%，比研究员设计的默认数据增强降低了 0.83%。

在 SVHN 上，我们将最新的误差从 1.30% 降到 1.02%。重要的是，我们发现 AutoAugment 策略是可转移的 - 为 ImageNet 数据集找到的策略也可以应用于其他视觉数据集（Stanford Cars、FGVC-Aircraft，等等），从而提高神经网络性能。

我们很高兴看到 AutoAugment 算法在竞争对手的许多不同计算机视觉数据集上都达到了这种性能水平，同时也期待这项技术未来在更多的计算机视觉任务，甚至在音频处理或语言模型等其他领域得到广泛应用。论文附录中提供了可实现最佳性能的策略，研究人员可以使用这些策略来改进相关视觉任务的模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

自动化

自动化

+关注

关注
29

文章
5581

浏览量
79283
计算机视觉

计算机视觉

+关注

关注
8

文章
1698

浏览量
45994
深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121170

原文标题：利用 AutoAugment 提升深度学习性能

文章出处：【微信号：tensorflowers，微信公众号：Tensorflowers】欢迎添加关注！文章转载请注明出处。

自动化

自动化技术，更好地做好市场服务工作；二是利用自动化技术，替代或减轻制造人员的体力和脑力劳动，直接为制造人员服务。E的含义是制造自动化应该有利于充分利用资源，减少废弃物和环境污染，有利于实现

发表于 05-24 18:59

工控仪器自动化

生产过程实现检测、控制、优化、调度、治理和决策，达到增加产量、进步质量、降低消耗、确保安全等目的的综合性技术，主要包括产业自动化软件、硬件和系统三大部分。产业控制自动化技术作为20世纪

发表于 09-17 15:37

工控仪器自动化

自动化：化学吸附micromeritics.com.cn/products_view.aspx?id=20产业控制自动化技术是一种运用控制理论、仪器仪表、计算机和其它信息技术，对产业生产过程实

发表于 09-17 16:06

实现工业自动化的市场阻碍

，虽然很多厂家都在宣传工业自动化、宣传物联网。但是仔细的分析可以发现，大多数厂家提供的只是通过开放式程序编程来链接云端应用，客户需要自己想办法来处理这些数据。买家多为中小企业，不太可能有足够的资源，来

发表于 09-11 15:54

自动化控制装置

他们知道何时停止何时起步。如今，该过程由交通信号灯操控，其可以自动从绿灯变为黄灯，再变为红灯，周而复始。无需人类介入，也不需交通管制员在雨天站在路中央指挥交通，车流即可高效可靠运行。如

发表于 02-05 11:11

汽车制造中的机械自动化技术应用

是否先进，其价值衡量的载体之一就是汽车制造等众多机械制造业所造就的生产发展实践效果。汽车制造的水平高低、质量优劣的重要主导因素也包含有机械自动化技术是否精准且先进。当前，随着汽车市场的

发表于 02-28 09:18

自动化设备数据采集系统

。此系统可以允许其他新的电子系统的加入，原有的具有其他功能的电子系统的移除或功能上的更新对整个自动化数据采集系统不会产生很大的影响，同时只需要很少的人工参与进行一些校对，并且此系统针对不同的服务对象

发表于 10-21 17:24

什么是过程自动化？

；使用蒸汽加热反应器或再沸器时，蒸汽压力必须稳定，一旦波动，会影响反应釜的温度控制；锅炉汽包控制和压力容器的压力控制； ... 这就要求过程设备能够在没有人直接参与的情况下，借助自动化系统的控制

发表于 10-26 11:48

工业自动化应用中有什么常见故障类型？

半导体技术和能力的进步为工业应用（特别是状态监控解决方案）检测、测量、解读、分析数据提供了新的机会。基于MEMS技术的新一代传感器与诊断预测应用的先进算法相结合，扩大了测量各种机器和提高能力的机会，有助于高效监控设备，延长正常运行时间，增强过程质量，提升产量。

发表于 08-09 07:38

配电自动化系统有哪些通信方式？通信过程是怎样的？

。　　配电自动化系统的通信过程　　配电自动化系统的通信过程可以简单描述如下：　　1. 数据采集：

发表于 04-10 17:10

LabVIEW与Tektronix示波器实现电源测试自动化

和Tektronix示波器解决了电源测试中的实际问题，实现了测试过程的自动化、高效化和精确化。这不仅显著提高了产品测试的效率和质量，

发表于 12-09 20:37

PlantPAX过程控制自动化系统

PlantPAX是罗克韦尔自动化为帮助您实现卓越的过程自动化控制而作出的重大举措，同时也代表罗克韦尔自动

发表于 08-27 21:46 •9次下载

如何区分电气自动化与过程自动化

大家常说的工业自动化控制，一般都是指两个方面：电气自动化与过程自动化。电气自动化控制是以跟随控制和位置动作控制为主线，如机械手，加工

发表于 04-13 11:23 •1489次阅读

过程自动化控制和运动自动化控制的原理详解

工业自动化从原理上可分为过程自动化与机械(运动)自动化。

发表于 09-25 10:52 •1696次阅读

机械自动化是自动化的一种吗

引言 自动化技术是指利用控制装置对生产过程进行控制，以实现生产过程的自动化。机械自动化是

发表于 07-01 09:32 •1673次阅读

搜索历史

数据增强过程是否也可以实现自动化？

评论

自动化

工控仪器自动化

工控仪器自动化

实现工业自动化的市场阻碍

自动化控制装置

汽车制造中的机械自动化技术应用

自动化设备数据采集系统

什么是过程自动化？

工业自动化应用中有什么常见故障类型？

配电自动化系统有哪些通信方式？通信过程是怎样的？

LabVIEW与Tektronix示波器实现电源测试自动化

PlantPAX过程控制自动化系统

如何区分电气自动化与过程自动化

过程自动化控制和运动自动化控制的原理详解

机械自动化是自动化的一种吗