使用强化学习从数据本身中找出最佳图像转换策略-电子发烧友网

谷歌研究人员最新提出了一种自动数据增强方法，受AutoML的启发，他们尝试将数据增强的过程也实现自动化，使用强化学习从数据本身中找出最佳图像转换策略，在不依赖于生成新的和不断扩展的数据集的情况下，提高了计算机视觉模型的性能。

计算机视觉深度学习的成功，可部分归因于拥有大量带标记的训练数据——数据的质、量和多样性提高，模型的性能也通常会增强。但是，要收集足够多的高质量数据训练模型来实现良好的性能，通常非常困难。

解决这个问题的一种方法，是将图像对称（image symmetries）硬编码为神经网络结构，或者，让专家手动设计数据增强方法，比如旋转和翻转图像，这些都是训练性能良好的视觉模型常会用到的方法。

但是，直到最近，人们很少关注如何利用机器学习来自动增强现有数据。谷歌此前推出了AutoML，代替人为设计的系统组件，让神经网络自动设计神经网络和优化器，得到了良好的结果。受此启发，谷歌研究人员不禁问自己：是否也可以让数据增强过程自动完成？

在最新公布的论文《AutoAugment：从数据学习增强策略》（AutoAugment: Learning Augmentation Policies from Data）中，谷歌的研究人员探索了一种强化学习算法，增加了现有训练数据集中数据的数量和多样性。直观地说，数据增强用于教会模型有关数据域中的图像不变性（image invariances），让神经网络对这些重要的对称性保持不变（invariant），从而改善其性能。

研究人员表示，与以前使用手工设计数据增强策略的先进深度学习模型不同，他们使用强化学习从数据本身中找出最佳图像转换策略。结果在不依赖于生成新的和不断扩展的数据集的情况下，提高了计算机视觉模型的性能。

训练数据的增强

数据增强的思路很简单：图像具有许多对称性，这些对称性不会改变图像中存在的信息。例如，狗的镜面反射仍然是狗。这些“不变性”中的一些对人类来说显而易见，但有很多人类很难注意到。例如，mixup方法，通过在训练期间将图像置于彼此之上来增强数据，从而产生改善神经网络性能的数据。

左图：来自ImageNet数据集的原始图像。右图：通过常用数据增强方法，水平翻转后的相同的图像。

AutoAugment是为计算机视觉数据集设计自定义数据增强策略的自动方式，例如，AutoAugment能指导基本图像转换操作的选择，例如水平/垂直翻转图像，旋转图像，更改图像颜色等。AutoAugment不仅可以预测要合并的图像转换，还可以预测所使用转换的每个图像的概率和大小，从而不总是以相同的方式操作图像。AutoAugment能够从2.9 x 10^32大的搜索空间中，选择出图像转换的最佳策略。

AutoAugment 根据所运行的数据集学习不同的转换。例如，对于包含数字自然场景的街景(SVHN)图像，AutoAugment 的重点是像剪切和平移这样的几何变换，它们代表了数据集中常见的失真现象。此外，由于世界上不同的建筑和房屋编号材料的多样性，AutoAugment机构已经学会了完全反转原始SVHN数据集中自然出现的颜色。

左：来自SVHN数据集的原始图像。右：相同的图像AutoAugment。在这种情况下，最优转换是剪切图像并反转像素颜色的结果。

在CIFAR-10和ImageNet上，AutoAugment 不使用剪切，因为这些数据集通常不包含剪切对象的图像，也不完全反转颜色，因为这些转换将导致不真实的图像。相反，AutoAugment r的重点是稍微调整颜色和色调分布，同时保持一般的色彩属性。这说明在CIFAR-10和ImageNet中对象的实际颜色是重要的，而在SVHN中只有相对的颜色是重要的。

结果

我们的AutoAugment 算法发现了一些最著名的计算机视觉数据集的增强策略，这些数据集被纳入到神经网络的训练中，会产生最先进的精确性。通过增强ImageNet数据，我们获得了83.54％ top1精度的新的最新精度，在CIFAR10上我们获得了1.48%的错误率，这比科学家设计的默认数据增强提高了0.83%。在SVHN上，我们将最先进的误差从1.30%提高到1.02%。重要的是，AutoAugment策略被发现是可转移的——为ImageNet数据集找到的策略也可以应用于其他视觉数据集（斯坦福汽车、FGVC-Aircraft等)，从而改善神经网络的性能。

我们很高兴地看到，我们的AutoAugment算法在许多不同的竞争性计算机视觉数据集上都达到了这样的性能水平，并期待着未来在更多的计算机视觉任务中，甚至在音频处理或语言模型等其他领域，都能应用这种技术。在本文的附录中包含了性能最好的策略，以便研究人员可以使用它们来改进他们在相关视觉任务上的模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4769

浏览量
100687
计算机视觉

计算机视觉

+关注

关注
8

文章
1698

浏览量
45965
机器学习

机器学习

+关注

关注
66

文章
8401

浏览量
132535

原文标题：谷歌放大招！数据增强实现自动化

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

反向强化学习的思路

强化学习的另一种策略（二）

发表于 04-03 12:10

深度强化学习实战

内容2:课程一： TensoRFlow入门到熟练：课程二：图像分类：课程三：物体检测：课程四：人脸识别：课程五：算法实现：1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成

发表于 01-10 13:42

强化学习在RoboCup带球任务中的应用刘飞

强化学习在RoboCup带球任务中的应用_刘飞

发表于 03-14 08:00 •0次下载

将深度学习和强化学习相结合的深度强化学习DRL

深度强化学习DRL自提出以来，已在理论和应用方面均取得了显著的成果。尤其是谷歌DeepMind团队基于深度强化学习DRL研发的AlphaGo，将深度强化学习DRL成推上新的热点和高度，成为人工智能历史上一个新的里程碑。因此，深

发表于 06-29 18:36 •2.8w次阅读

基于强化学习的IEEE 802.15.4网络区分服务策略

为了弥补IEEE 802.15.4协议原有区分服务机制的不足，提出了一种基于BCS（backoff counter scheme）与强化学习的区分服务策略。从终端节点出发，在原优先级区分服务策

发表于 03-09 16:02 •0次下载

人工智能机器学习之强化学习

强化学习是智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大，强化学习不同于连接主义学习

发表于 05-30 06:53 •1408次阅读

什么是强化学习？纯强化学习有意义吗？强化学习有什么的致命缺陷？

强化学习是人工智能基本的子领域之一，在强化学习的框架中，智能体通过与环境互动，来学习采取何种动作能使其在给定环境中的长期奖励最大化，就像在上

发表于 07-15 10:56 •1.8w次阅读

如何使用深度强化学习进行机械臂视觉抓取控制的优化方法概述

针对提高视觉图像特征与优化控制之间契合度的问题，本文提出一种基于深度强化学习的机械臂视觉抓取控制优化方法，可以自主地从与环境交互产生的视觉图像中

发表于 12-19 15:23 •22次下载

对NAS任务中强化学习的效率进行深入思考

在一些情况下，我们会用策略函数（policy，总得分，也就是搭建的网络在测试集上的精度（accuracy），通过强化学习（Reinforcement Learning）这种通用黑盒算法来优化。然而，因为强化学习

发表于 01-28 09:54 •5034次阅读

强化学习在智能对话上的应用介绍

本文主要介绍深度强化学习在任务型对话上的应用，两者的结合点主要是将深度强化学习应用于任务型对话的策略学习上来源：腾讯技术工程微信号

发表于 12-10 19:02 •1031次阅读

机器学习中的无模型强化学习算法及研究综述

根据真实环境的状态转移数据来预定义环境动态模型，随后在通过环境动态模型进行策略学习的过程中无须再与环境进行交互。在无模型强化学习

发表于 04-08 11:41 •11次下载

《自动化学报》—多Agent深度强化学习综述

突破.由于融合了深度学习强大的表征能力和强化学习有效的策略搜索能力,深度强化学习已经成为实现人工智能颇有前景的学习范式.然而,深度

发表于 01-18 10:08 •1609次阅读

模拟矩阵在深度强化学习智能控制系统中的应用

讯维模拟矩阵在深度强化学习智能控制系统中的应用主要是通过构建一个包含多种环境信息和动作空间的模拟矩阵，来模拟和预测深度强化学习智能控制系统在不同环境下的表现和效果，从而优化控制策略和提

发表于 09-04 14:26 •562次阅读

通过强化学习策略进行特征选择

更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。在本文中，我们将介绍并实现一种新的通过强化学习策略的特征选择。我们先讨论强化学习，尤其是马尔可夫决策

发表于 06-05 08:27 •343次阅读

如何使用 PyTorch 进行强化学习

的计算图和自动微分功能，非常适合实现复杂的强化学习算法。 1. 环境（Environment）在强化学习中，环境是一个抽象的概念，它定义了智能体（agent）可以执行的动作（actions）、观察到

发表于 11-05 17:34 •271次阅读