0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探索GAN的景观,并讨论常见的陷阱和可重复性等问题

DPVg_AI_era 来源:未知 作者:李倩 2018-07-16 10:13 次阅读

随着GAN越来越多的应用到实际研究当中,其技术中的缺陷与漏洞也随之出现。从实际角度对GAN的当前状态进行深入挖掘与理解就显得格外重要。来自Google Brain的Karol Kurach等人重现了当前的技术发展水平,探索GAN的景观,并讨论常见的陷阱和可重复性等问题。

从实际角度对GAN的当前状态进行深入挖掘与理解对GAN的发展有着重要的意义。来自Google Brain的Karol Kurach等人重现了当前的技术发展水平,探索GAN的景观,并讨论常见的陷阱和可重复性等问题。Lan Goodfellow等AI界大咖也对此成果表示赞同,并纷纷转载。

深度生成模型可以应用于学习目标分布的任务。 他们最近在各种应用程序中被利用,在自然图像的背景下充分发挥其潜力。 生成对抗网络(GAN)是以完全无监督的方式学习这些模型的主要方法之一。 GAN框架可以被视为一个双人游戏,其中第一个“玩家”,生成器(generator),正在学习将一些简单的输入分布(通常是标准的多元正态或均匀)转换为图像空间上的分布,这样第二个“玩家”,鉴别器(discriminator),无法判断样本是属于真实分布还是合成。 两位“玩家”的目标都是尽量减少自己的损失,而比赛的解决方案就是Nash均衡(equilibrium),任何“玩家”都不能单方面改善他们的损失。 还可以通过最小化模型分布和真实分布之间的统计差异来导出GAN框架。

训练GAN需要解决发生器和鉴别器参数的最小极大(nimimax)问题。 由于发生器和鉴别器通常都被参数化为深度卷积神经网络,所以这种极小极大(minimax)问题在实践中是非常困难的。 为此,提出了许多损失函数,正则化和归一化以及神经结构的方案来做选择。 其中一些是基于理论见解得出的,而另一些则是实际考虑角度出发的。

在这项工作中,我们对这些方法进行了全面的实证分析。我们首先定义GAN landscape—损失函数集,归一化和正则化方案以及最常用的体系结构。我们通过超参数优化(hyperparameter optimization),在几个现代大规模数据集以及高斯过程回归(Gaussian Process regression)获得的数据集上探索这个搜索空间。 通过分析损失函数的影响,我们得出结论,非饱和损失(non-saturating loss)在数据集、体系结构和超参数之间足够稳定。然后,我们继续分析各种归一化和正则化方案以及不同的体系结构的效果。我们表明,梯度抑制(gradient penaltyas)以及频谱归一化(spectral normalization)在高容量(high-capacity)结构的背景下都是有用的。然后,我们发现人们可以进一步受益于同时正规化和规范化。最后,我们讨论了常见的陷阱,可重复性问题和实际考虑因素。

GAN Landscape

损失函数

令P表示目标分布,Q表示模型分布。原始的GAN公式有两种损失函数:minimax GAN和非饱和(NS) GAN。前者,鉴别器最小化二分类问题的负对数似然(即样本是真的还是假的),相当于最小化P和Q之间的Jensen-Shannon(JS)偏差。后者,生成器最大化生成样本是真实的概率。对应的损失函数定义为:

在综合考虑前人的研究后,我们考虑用最小平方损失(LS),相当于最小化P和Q之间的Pearson卡方散度(divergence)。对应的损失函数定义为:

鉴别器的归一化和正则化

Gradient norm penalty

在训练点和生成的样本之间的线性插值上评估梯度,作为最佳耦合的代理(proxy)。 还可以在数据流形周围评估梯度损失,这促使鉴别器在该区域中成分段线性。梯度范数惩罚可以纯粹被认为是鉴别器的正则化器,并且它表明它可以改善其他损失的性能。计算梯度范数(gradient norms)意味着一个非平凡的运行时间惩罚(penalty) - 基本上是运行时间的两倍。

鉴别器归一化

从优化角度(更有效的梯度流、更稳定的优化)以及从表示的角度来看,归一化鉴别器是有用的 - 神经网络中层的表示丰富度取决于相应权重的谱结构矩阵。

从优化角度来看,一些关于GAN的技术已经成熟,例如: Batch normalization和Layer normalization (LN);从表示的角度来看,必须将神经网络视为(可能是非线性)映射的组合并分析它们的光谱特性(spectral properties)。特别地,为了使鉴别器成为有界线性算子,控制最大奇异值(maximum singular value)就可以了。

生成器和鉴别器机构

我们在这项研究中探索了两类架构:深度卷积生成对抗网络(DCGAN)和残余网络(ResNet)。ResNet19是一种架构,在生成器中有五个ResNet块,在鉴别器中有六个ResNet块,可以在128×128图像上运行。我们在每个鉴别器块中进行下采样,并且第一个块不包含任何自定义更改。 每个ResNet块由三个卷积层组成,这使得鉴别器总共有19层。 表3a和表3b总结了鉴别器和发生器的详细参数。 通过这种设置,我们能够重现并改进当前已有的最好结果。

评估方法

我们专注于几个最近提出的非常适合图像域的指标。

Inception Score (IS)

IS提供了一种定量评估生成样本质量的方法。 包含有意义对象的样本的条件标签分布应该具有低熵,并且样本的可变性应该高。 IS可以表示为:

来自P和Q的样本首先嵌入到特征空间(InceptionNet的特定层)中。 然后,假设嵌入数据遵循多元高斯分布,估计均值和协方差。 最后,计算这两个高斯之间的Fréchet距离:

图像质量(MS-SSIM)和多样性的多尺度结构相似性

GAN中的一个关键问题是模式崩溃和模式丢失 - 无法捕获模式,或者从给定模式生成样本的多样性较低。MS-SSIM得分用于测量两个图像的相似度,其中较高的MS-SSIM得分表示更相似的图像。

数据集

我们考虑三个数据集,即CIFAR10,CELEBA-HQ-128和LSUN-BEDROOM。LSUN-BEDROOM数据集[包含300多万张图像。 我们将图像随机分成训练集和测试集,使用30588张图像作为测试集。 其次,我们使用30k张图像的CELEBA-HQ数据集,将3000个示例作为测试集,其余示例作为训练集。 最后,为了重现现有结果,我们还采用了CIFAR10数据集,其中包含70K张图像(32x32x3),60000个训练实例和10000个测试实例。 CELEBA-HQ-128的基线FID评分为12.6,LSUN-BEDROOM为3.8,CIFAR10为5.19。

实验结果

损失函数的影响

非饱和(NS)损失在两个数据集上都是稳定的

Gradient penalty和光谱(spectral)归一化提高了模型质量。 从计算预算的角度来看(即,需要训练多少个模型以达到某个FID),光谱归一化和Gradient penalty都比基线表现更好,但前者更有效。

Gradient penalty和谱归一化(SN)都表现良好,应该被认为是可行的方法,而后者在计算成本上更好。 可惜的是,没有人能完全解决稳定性问题。

归一化和正则化的影响

Gradient penalty加上光谱归一化(SN)或层归一化(LN)大大提高了基线的性能

生成器和鉴别器结构的影响

鉴别器和发生器结构对非饱和GAN损失的影响。光谱归一化和Gradient penalty可以帮助改进非正则化基线。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 发生器
    +关注

    关注

    4

    文章

    1368

    浏览量

    61711
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1939

    浏览量

    73559
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24717

原文标题:【GAN全局实用手册】谷歌大脑最新研究,Goodfellow力荐

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    具有10MHz的重复性能的有源滤波器模块LT1568

    DN324精密有源滤波器模块,具有10MHz的重复性
    发表于 06-06 16:45

    PGA-SAR系统无法达到12比特级别的重复性时,Δ-Σ系统会怎么样呢?

    PGA-SAR系统如何才能达到12比特重复性性能?PGA-SAR系统无法达到12比特级别的重复性时,Δ-Σ系统会怎么样呢?Δ-Σ转换器的过程增益如何?
    发表于 04-07 06:34

    测量系统的的重复性和重现性

    测量系统的的重复性和重现性:在MSA中的相当重要的一部分是研究测量系统的重复性(Repeatability)和重现性(Reproducibility). 在六个西格玛的方法论中, 也是每个项目都必须要完成的工作.
    发表于 08-16 13:14 17次下载

    相控阵探头的重复性与可靠性

    相控阵探头的重复性与可靠性 Over the past few years, new procedures involving phased array technology were
    发表于 03-20 10:45 24次下载

    选转换器?考虑下时序、精确度和重复性以外的参考

    在您决定哪种转换器最为适合于您的应用时,您可能会首先想到速度、精确度以及未来系统的重复性。好吧,这都没问题,但请不要局限于这些显而易见的东西。
    发表于 03-06 10:04 678次阅读

    并行传感器如何提高倾斜测量的精度和重复性

    并行传感器如何提高倾斜测量的精度和重复性?具体的跟随小编通过本文来详细的了解下。
    的头像 发表于 07-11 13:27 3381次阅读

    基于赛灵思FPGA设计的整体时序具有完全重复性

    满足设计的时序要求本身已非易事,而要实现某项设计的整体时序具有完全重复性有时候却是不可能的任务。幸运的是,设计人员可以借助有助于实现重复时序结果的设计流程概念。影响最大的四个方面
    发表于 11-24 19:07 797次阅读

    微带传输线PIM测试可重复性的问答详解

    罗杰斯“微带传输线无源互调(PIM)测试可重复性”技术讲座已于6月10日上午10:00-12:00成功召开。以下是精选了一些网友所提出的问题及罗杰斯技术专家的解答,与您分享。网友提问:反转铜箔和普通
    发表于 01-25 10:31 3次下载

    机器人技术的重复性和准确性分析

    工业机器人具有许多度量或可测量的特征,这将直接影响机器人在执行任务期间的效率。可测量特性主要指的是重复性和准确性。
    发表于 09-17 14:47 2829次阅读
    机器人技术的<b class='flag-5'>可</b><b class='flag-5'>重复性</b>和准确性分析

    计量标准重复性的测量方法

    计量标准的重复性规定用测量结果的分散性来定量地表示,即用单次测量结果yi的实验标准差s(yi)来表示。当测量结果由单次测量得到时,它直接就是由重复性引入的不确定度分量。
    的头像 发表于 11-12 14:19 2w次阅读

    计量标准的重复性考核要求

    计量标准的重复性规定用测量结果的分散性来定量地表示,即用单次测量结果yi的实验标准差s(yi)来表示。当测量结果由单次测量得到时,它直接就是由重复性引入的不确定度分量。当
    的头像 发表于 03-18 10:21 3377次阅读

    如何实现FPGA的重复性设计

    HDL 设计         具有非常高的资源利用率和频率要求的设计要获得重复的结果是一件最具挑战性的事情,但是它们也是最需要重复结果的设计。获得
    的头像 发表于 02-09 03:05 833次阅读

    计量标准的重复性考核要求

    在进行重复性测量时,相同的测量程序,相同的观测者,使用相同的仪器,以及相同地点要求一般均能得到满足而不会有任何问题。关键是如何理解“在相同的条件下”以及“在短时间内重复测量”这两条要求。
    的头像 发表于 07-19 15:52 2370次阅读
    计量标准的<b class='flag-5'>重复性</b>考核要求

    立仪科技光谱共焦应用之金属隔膜静态重复性测量

    01|检测需求:金属隔膜重复性测量   立仪科技光谱共焦应用之金属隔膜静态重复性测量 02|检测方式 为了保证精度,首先先用千分尺进行测量,得出相应的厚度数据,在选择合适的侧头,根据结果,我们现在立
    的头像 发表于 08-09 14:33 271次阅读
    立仪科技光谱共焦应用之金属隔膜静态<b class='flag-5'>重复性</b>测量

    精密高压开关:实现安全、可靠性和重复性 (一)

    的模块化开关系统如何以安全、可靠和高重复性,以满足不断提高的电压水平下对精密开关的新需求,并同时讨论改善测量性能与准确度的方法。 目录 对高压开关的需求从何而来? 为什么是500 V? 模块化测试系统在高压应用中的优势 安全、
    的头像 发表于 12-05 11:53 137次阅读