0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析图像分类器结构搜索的正则化异步进化方法 并和强化学习方法进行对比

zhKF_jqr_AI 2018-02-09 14:47 次阅读

最近神经网络的成功不断扩展着模型的架构,并促成了架构搜索的出现,即神经网络自动学习架构。架构搜索的传统方法是神经演化,如今,硬件的发展能实现大规模的演变,生成可以与手工设计相媲美的图像分类模型。但是,新的技术虽然可行,却无法让开发者决定在具体的环境下(即搜索空间和数据集)使用哪种方法。

在本篇论文中,研究人员使用流行的异步进化算法(asynchronous evolutionary algorithm)的正则化版本,并将其与非正则化的形式以及强化学习方法进行比较。硬件条件、计算能力和神经网络训练代码都相同,在这之中研究人员探索在不同的数据集、搜索空间和规模下模型的表现情况。以下是论智对论文的编译总结。

实验方法

我们使用不同的算法搜索神经网络分类器的空间,进行基线研究后,所得到的最好的模型将被扩大尺寸,以生产更高质量的图像分类器。我们在不同的计算规模上执行搜索过程。另外,我们还研究了非神经网络模拟中的进化算法。

1.搜索空间

所有神经进化和强化学习实验都使用基线研究的搜索空间设计,它需要寻找两个类似于Inception的模块体系结构,这两个结构在前馈模式中堆叠以形成图像分类器。

2.架构搜索算法

对于进化算法,我们使用联赛选择算法(tournament selection)或正则化的变体。标准的联赛选择算法是对训练模型P的数量进行周期化的改进。在每个循环中,随机选择一个S模型的样本。样本的最佳模型将生成具有变化架构的另一模型,它将被训练然后添加到模型样本中。最差的模型将被删除。我们将这种方法称为非正则进化(NRE)。它的变体,正则化进化(RE)则是一种自然的修正:无需删除样本中最差的模型,而是删除样本中最老的模型(即第一个被训练的模型)。在NRE和RE中,样本初始化的架构都是随机的。

3.实验设置

为了对比进化算法和强化学习算法,我们将在不同的计算规模上进行实验。

小规模试验

首先进行的实验可以在CPU上进行,我们部署了SP-I、SP-II和SP-III三种搜索空间,利用G-CIFAR、MNIST或者G-ImageNet数据集进行实验。

大规模实验

然后再部署基线研究的设置。这里仅用SP-I搜索空间和CIFAR-10数据集,两种模型各在450个GPU上训练将近7天。

4.模型扩展

我们要将进化算法或强化学习发现的架构转化为全尺寸、精确的模型。扩展后的模型将在CIFAR-10或ImageNet上进行训练,程序与基线研究的相同。

实验结果

解析图像分类器结构搜索的正则化异步进化方法 并和强化学习方法进行对比

正则化与非正则化进化的对比。(a)表示在G-CIFAR数据集上非正则化进化和正则化进化用不同的元参数进行的小规模实验结果对比。P代表样本数量,S代表样本大小。(b)表示NRE和RE在五种不同情况下的表现,从左至右分别为:G-CIFAR/SP-I、G-CIFAR/SP-II、G-CIFAR/SP-III、MNIST/SP-I和G-ImageNet/SP-I。(c)表示模拟结果,竖轴表示模拟的精确度,横轴表示问题的维度。(d)表示在CIFAR-10上进行的三次大规模试验。

接着,我们在不同的情况下对强化学习和进化算法进行了小规模实验,结果如下:

解析图像分类器结构搜索的正则化异步进化方法 并和强化学习方法进行对比

(a)显示了在G-CIFAR上对超参数进行优化的实验总结,竖轴表示实验中前100名的模型的平均有效精度。结果表明所所有方法都不够敏感。(b)同样是在模型五种不同情况下的表现:G-CIFAR/SP-I、G-CIFAR/SP-II、G-CIFAR/SP-III、MNIST/SP-I和G-ImageNet/SP-I。(c)和(d)表示模型分别在G-CIFAR/SP-II和G-CIFAR/SP-III上的表现细节,横轴表示模型的数量。(e)表示在资源有限的情况下,可能需要尽早停止实验。说明了在初始状态下,进化算法的精确度比强化学习增长得快得多。(f)和(g)分别是SP-I和SP-III最顶尖的架构。

比较完小规模实验,接着进行的是大规模实验。结果如下图所示,黄色代表进化算法,蓝色代表强化学习:

解析图像分类器结构搜索的正则化异步进化方法 并和强化学习方法进行对比

除了(d)图,所有横轴均表示模型的数量(m)。(a)、(b)、(c)三图分别展示了三种算法在五次相同实验的情况,进化算法和强化学习实验使用了最佳元参数。

经过进化实验,我们确定了最佳模型并将其命名为AmoebaNet-A。通过调整N和F,我们可以降低测试错误率,如表1所示:

解析图像分类器结构搜索的正则化异步进化方法 并和强化学习方法进行对比

表1

在相同的实验条件下,基线研究得到了NASNet-A。表2显示,在CIFAR-10数据集中,AmoebaNet-A在匹配参数时错误率较低,在匹配错误时,参数较少。同时在ImageNet上的表现也是目前最好的。

解析图像分类器结构搜索的正则化异步进化方法 并和强化学习方法进行对比

表2

最后我们对比了手动设计、其他架构以及我们模型的性能对比,准确率均高于其他两种。

解析图像分类器结构搜索的正则化异步进化方法 并和强化学习方法进行对比

表3

结语

大规模的实验过程图表明,强化学习和进化算法都接近一般精度渐近线,所以我们需要关注的是哪个算法更快到达。图中显示强化学习要用两倍的时间到达最高精度的一半,换句话说,进化算法的速度大约比强化学习快一倍。但是我们忽略了进一步量化这一效果。另外,搜索空间的大小还需进一步评估。大空间所需专业资源较少,而小空间能更快更好地获得结果。因此,在较小空间中很难区分哪种搜索算法更好。

不过,这一研究仅仅是在特定环境下分析进化算法和强化学习之间关系的第一个实证研究,我们希望今后的工作能进一步总结二者,阐释两种方法的优点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 进化算法
    +关注

    关注

    0

    文章

    10

    浏览量

    7406
  • 强化学习
    +关注

    关注

    4

    文章

    266

    浏览量

    11246

原文标题:图像分类器结构搜索的正则化异步进化方法

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    渐进式神经网络结构搜索技术

    我们提出一种学习卷积神经网络(CNN)结构的新方法,该方法比现有的基于强化学习进化算法的技术更
    的头像 发表于 08-03 09:32 5422次阅读

    深度强化学习实战

    内容2:课程一: TensoRFlow入门到熟练:课程二:图像分类:课程三:物体检测:课程四:人脸识别:课程五:算法实现:1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成
    发表于 01-10 13:42

    一种基于机器学习的建筑物分割掩模自动正则和多边形方法

    摘要我们提出了一种基于机器学习的建筑物分割掩模自动正则和多边形方法。以图像为输入,首先使用通
    发表于 09-01 07:19

    深度学习技术的开发与应用

    2.算法设计 3.实验结果高频问题:如何将一个控制问题设计成马尔可夫决策问题并使用强化学习算法进行训练关键点:1.基于模型的离线强化学习方法 2.基于数据的在线强化学习方法实操
    发表于 04-21 14:57

    图像分类方法之深度学习与传统机器学习

    实际情况非常复杂,传统的分类方法不堪重负。现在,我们不再试图用代码来描述每一个图像类别,决定转而使用机器学习方法处理
    发表于 09-28 19:43 0次下载

    基于数据挖掘的医学图像分类方法

    一种深度学习的新方法卷积受限玻尔兹曼机模型,并且采用改进的快速持续对比散度算法对模型进行训练。该方法直接从乳腺X光
    发表于 11-22 16:32 8次下载

    斯坦福提出基于目标的策略强化学习方法——SOORL

    为了达到人类学习的速率,斯坦福的研究人员们提出了一种基于目标的策略强化学习方法——SOORL,把重点放在对策略的探索和模型选择上。
    的头像 发表于 06-06 11:18 5412次阅读
    斯坦福提出基于目标的策略<b class='flag-5'>强化学习方法</b>——SOORL

    使用加权密集连接卷积网络的深度强化学习方法说明

    针对深度强化学习中卷积神经网络(CNN)层数过深导致的梯度消失问题,提出一种将密集连接卷积网络应用于强化学习方法。首先,利用密集连接卷积网络中的跨层连接结构
    发表于 01-23 10:41 3次下载
    使用加权密集连接卷积网络的深度<b class='flag-5'>强化学习方法</b>说明

    谷歌和DeepMind研究人员合作提出新的强化学习方法Dreamer 可利用世界模型实现高效的行为学习

    近年来随着强化学习的发展,使得智能体选择恰当行为以实现目标的能力得到迅速地提升。目前研究领域主要使用两种方法:一种是无模型(model-free)的强化学习方法,通过试错的方式来学习
    发表于 03-26 11:41 1968次阅读

    深度学习图像分割的方法和应用

    介绍使图像分割的方法,包括传统方法和深度学习方法,以及应用场景。 基于人工智能和深度学习方法的现代计算机视觉技术在过去10年里取得了显著进展
    的头像 发表于 11-27 10:29 3168次阅读

    进化算法为搜索策略实现神经架构搜索方法

    自动深度学习是目前深度学习领域的研究热点,神经架构搜索算法是实现自动深度学习的主要
    发表于 03-22 14:37 15次下载
    以<b class='flag-5'>进化</b>算法为<b class='flag-5'>搜索</b>策略实现神经架构<b class='flag-5'>搜索</b>的<b class='flag-5'>方法</b>

    模型深度强化学习应用研究综述

    强化学习。无模型强仳学习方法的训练过程需要大量样本,当采样预算不足,无法收集大量样本时,很难达到预期效果。然而,模型强化学习可以充分利用环境模型,降低真实样本需求量,在一定程度上提高
    发表于 04-12 11:01 9次下载
    模型<b class='flag-5'>化</b>深度<b class='flag-5'>强化学习</b>应用研究综述

    基于深度强化学习的无人机控制律设计方法

    基于深度强化学习的无人机控制律设计方法
    发表于 06-23 14:59 46次下载

    使用深度学习方法对音乐流派进行分类

    电子发烧友网站提供《使用深度学习方法对音乐流派进行分类.zip》资料免费下载
    发表于 02-08 10:02 1次下载
    使用深度<b class='flag-5'>学习方法</b>对音乐流派<b class='flag-5'>进行</b><b class='flag-5'>分类</b>

    如何使用 PyTorch 进行强化学习

    强化学习(Reinforcement Learning, RL)是一种机器学习方法,它通过与环境的交互来学习如何做出决策,以最大化累积奖励。PyTorch 是一个流行的开源机器学习库,
    的头像 发表于 11-05 17:34 280次阅读