0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员们提出了PBA的方法来获取更为有效的数据增强策略

nlfO_thejiangme 来源:lq 2019-08-02 15:56 次阅读

近年来深度学习模型的飞速发展离不开庞大的数据体量和多样化的数据收集。收集大量的、丰富的数据是十分耗时耗力的工作,而数据增强则为研究人员们提供了另一种增加数据多样性的可能,无需真正收集数据即可得到较为丰富多样的训练数据。来自伯克利的研究人员们提出了PBA(Population Based Augmentation)的方法来获取更为有效的数据增强策略,并在实现同样效果下实现了1000x的加速。

数据增强

数据增强策略通常包括剪切、填充、翻转和旋转等,但这些基本策略对于深度网络的训练还是太简单,在对于数据增强策略和种类的研究相较于神经网络的研究还是太少了。

一些常见的数据增强方法

最近谷歌针对这方面进行了深入的探索性的研究,提出了AutoAugment方法并在CIFAR-10数据集上取得了很好的成果。

这篇论文利用了强化学习等方法来搜索更好的数据增强策略,基于RNN的控制器从搜索空间中预测增强策略,而一个固定架构的子网络则用于在增强的数据上进行训练收敛到精度R,最后利用精度R来作为奖励使得控制器寻求更好的数据增强策略。

AutoAugment引入了16种几何、色彩变换并从中选择两种以固定的幅度来对每一批数据进行增强,所以高性能的增强方法可以通过强化学习直接由模型从数据中学习到。但这种方法的弊端在于它需要训练一万五千个模型到收敛,以便为强化学习模型收集足够的样本来学习数据增强策略。在样本间的计算不能共享,使得它要耗费15000个P100计算时来在ImageNet上实现较好的效果,即使在较小的CIFAR-10上也要消耗5000个GPU时(这意味着需要7500-37500美元的训练费用才能得到较好的数据增强策略)。如果可以将先前训练的策略迁移或共享到新的训练中去,就能更高效地实现数据增强策略的搜索与获取。

PBA算法

为了提高算法的效率,来自伯克利的研究人员提出了PBA算法,可以在比原算法少三个数量级的计算上获得相同的测试精度。

与AutoAugment不同,这种方法在多个小模型的副本上训练CIFAR-10数据集,只需要在Titan XP上训练5小时即可得到较好的数据增强策略,这一策略应用到CIFAR-100,并重新训练一个较大的网络可以获得十分有效的效果。与先前需要很多天的训练相比,这种方法耗时更短且得到的效果更好。

与AutoAugment相比,新方法给出的数据增强策略在不同模型上的表现。

研究人员从DeepMind的Population Based Training算法中借鉴了一些思想,并将其应用在了数据增强策略的生成上,将训练中当前的结果作为生成策略的基础,使得训练的结果可以在不同子模型中共享,避免耗时的重复训练。

这一改进使得通常的工作站也可以训练大型的数据增强策略算法。与AutoAugment不同,这一方法生成了一个策略调度方法而不是一个固定的策略。这意味着,在某个训练周期,PBA生成的数据增强策略是法f(x,t),其中x是输入图像,t为当前的训练周期。而AutoAugment则会在不同的子模型上生成固定的策略fi(x)。

研究人员利用了16个小的WideResNet,每一个会学习出不同的超参数计划,而其中表现最好的调度将会被用于训练大型的模型,并从中得出最后的测试错误率。

Population Based Training方法,首先将一系列小模型用于发现超参数,而后将表现最好的模型权重(exploit)与随机搜索结合起来(explore)。这些小模型首先在目标数据集上从零开始训练,随后通过将高性能的超参数复制到表现欠佳的模型上实现训练过程的复用,而后利用超参数的扰动来实现随机探索,以获取更好的表现。

通过这样的方法,研究人员得以共享不同模型间的计算,并共享不同训练阶段得到的不同的目标超参数。PBA算法通过这一手段避免了需要训练上千个模型才能获得高性能数据增强策略的冗长过程。下图显示了研究人员获取的数据增强策略:

研究人员还提供了源码和使用实例,如果想要给自己的数据集学习出合适的数据增强策略,可以在TUNE框架下进行,只需要简单的定义新的数据加载器即可使用。详情请参考代码:

https://github.com/arcelien/pba

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    112

    文章

    16356

    浏览量

    177991
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100754
  • 深度学习
    +关注

    关注

    73

    文章

    5503

    浏览量

    121152

原文标题:1000倍提速!伯克利提出新的数据增强策略训练方法,更好更快扩充数据

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    安全研究人员用短信遥控开车门

    SEC的安全研究人员声称已经找到一种方法来解锁宝马、通用、福特和现代四大汽车制造商的车门,他们实施逆向工程破解了这些汽车的遥控系统,并可以在数小时内完成一台车的解码
    发表于 07-29 09:43 1005次阅读

    研究人员提出了“Skim-RNN”的概念,用很少的时间进行快速阅读

    注意力模型和LSTM等方法提高计算效率或挑选重要任务,但它们的表现都不够好。在本篇论文中,研究人员提出了“Skim-RNN”的概念,用很少的时间进行快速阅读,不影响读者的主要目标。
    的头像 发表于 01-10 12:41 3609次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>“Skim-RNN”的概念,用很少的时间进行快速阅读

    Google研究人员开发增强现实显微镜检测癌细胞

    Google的研究人员开发了一种增强现实显微镜(ARM),该显微镜可以从一个经过训练的神经网络中获取实时数据,以检测癌细胞,并将其显示在查看图像的病理学家的视野中。
    发表于 04-23 12:09 2248次阅读

    斯坦福提出基于目标的策略强化学习方法——SOORL

    为了达到人类学习的速率,斯坦福的研究人员提出了一种基于目标的策略强化学习方法——SOORL,把重点放在对
    的头像 发表于 06-06 11:18 5419次阅读
    斯坦福<b class='flag-5'>提出</b>基于目标的<b class='flag-5'>策略</b>强化学习<b class='flag-5'>方法</b>——SOORL

    一种新方法来检测这些被操纵的换脸视频的“迹象”

    利用深度学习“换脸”合成假视频的技术发展之快令人惊叹,也令人深感不安。研究人员已经研究出一种新方法来检测这些被操纵的换脸视频,通过有效地预测眼睛的状态,准确率达到99%。
    的头像 发表于 07-03 09:48 5794次阅读

    一种新型获取太阳能以及如氢气类的清洁燃料的方法

    西澳大利亚科廷大学的研究人员开发了一种低成本、环保的方法来获取太阳能以及如氢气类的清洁燃料。 科廷大学的研究人员在生产太阳能等清洁燃料方面取得了突破性进展,更好的向低碳经济转型。
    的头像 发表于 06-07 16:58 2201次阅读

    研究人员探究大脑如何控制主动传感

    研究中的研究人员使用增强现实技术改变主动感知行为与其产生的感官反馈之间的联系,并更多地了解该过程的工作原理。
    的头像 发表于 12-29 15:11 2975次阅读

    研究人员提出了一系列新的点云处理模块

    为了探索这些问题的解决办法、来自伦敦大学学院的研究人员提出了一系列新的点云处理模块,从效率、信息共享和点云卷积操作等方面进行了研究,得到了更宽、更深、更快效率更高的点云处理网络,让更
    的头像 发表于 08-02 14:44 3060次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>们</b><b class='flag-5'>提出了</b>一系列新的点云处理模块

    JD和OPPO的研究人员提出了一种姿势引导的时尚图像生成模型

    研究人员的主要目的在于训练一个生成模型,将模特在当前姿势上的图像迁移到其他的目标姿势上去,实现对于衣着等商品的全面展示。
    的头像 发表于 08-02 14:50 2553次阅读

    研究人员提出了一种多尺度高效率的新模型FAMED-Net

    而基于学习的方法采用了数据驱动的方法来学习出图像特征和透射率之间的关系,克服了手工选取先验特征的不足。随着深度学习的方法,这种方法朝着更强大
    的头像 发表于 08-02 15:08 3883次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>一种多尺度高效率的新模型FAMED-Net

    Facebook的研究人员提出了Mesh R-CNN模型

    这一研究的目标是通过单张图像输入,对图像中的物体进行检测、获取不同物体的类别、掩膜和对应的三维网格,并对真实世界中的复杂模型进行有效处理。在2D深度网络的基础上,研究人员改进并
    的头像 发表于 08-02 15:51 3886次阅读
    Facebook的<b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    研究人员使用声音技术进行药物的传递

    从电信技术改造而来的技术有望实现更有效的癌症治疗。墨尔本研究人员发现,药物可以通过声波传递到各个细胞中。
    发表于 03-11 09:38 480次阅读

    研究人员出了一种新的基于深度学习的策略

    苏黎世联邦理工学院的研究人员最近推出了一种新的基于深度学习的策略,该策略可以在不需要大量真实数据的情况下在机器人中实现触觉传感。在arXiv
    的头像 发表于 03-26 15:47 2607次阅读

    马来西亚研究人员提出一种评估光伏模块不同冷却系统有效性的新方法

    马来西亚多媒体大学研究人员发表的一篇新论文提供了一种评估光伏模块不同冷却系统有效性的新方法。所提出的技术依赖于在附加冷却的情况下测量模块的输出,并将其与标准测试条件下的额定功率进行比较
    发表于 04-17 15:47 717次阅读

    研究人员找到了一种更好的方法来冷却 GaN 器件

    佐治亚理工学院的研究人员开发了一种新的键合技术,可以改善 GaN 器件的冷却效果,从而转化为各种应用的更好性能,包括无线发射器、雷达和卫星设备
    发表于 08-17 15:57 522次阅读
    <b class='flag-5'>研究人员</b>找到了一种更好的<b class='flag-5'>方法来</b>冷却 GaN 器件