0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探讨GAN背后的数学原理(下)

jf_78858299 来源:人工智能大讲堂 作者:人工智能大讲堂 2023-03-17 10:02 次阅读

2.2 判别器:有问题?GAN来了!

GAN由生成器G和判别器D组成。

其实上面我们已经基本介绍了生成器G的由来了,并且我们遇到了一个问题: 图片极其复杂的计算方式导致使用极大似然估计根本无从下手啊!!!

为了解决这个问题,我们引入了判别器D!

现在GAN的结构就完备了!!

对于生成器G:

  1. G 是一个函数,输入图片 ,输出(上面已经介绍了)

    图片

  2. 先验分布 图片, 图片和G共同决定的分布图片

对于判别器D:

  1. D是一个函数,输入图片,输出一个scalar
  2. D用于评估图片图片之间的差异(解决上一小节提出的问题)

那么,GAN的最终目标-->用符号化语言表示就是:

图片

我们的目标是得到使得式子图片最小的生成器图片.

关于V:

图片

给定G, 图片衡量的就是分布图片图片的差异。

因此,图片也就是我们需要的使得差异最小的 G .

详细解释 V(G,D) :

对于图片:

固定G ,最优图片 最大化:

图片

假设D(x) 可以表达任何函数

此时再固定 x ,则对于 图片,我们可将其看成是关于D的函数: 图片

图片

解得

图片

即:

图片

则此时对于原式 V(G,D) (将图片代入):

图片

JSD表示JS散度,它是KL散度的一种变形,也表示两个分布之间的差异:

图片

与KL散度不同,JS散度是对称的。

以上的公式推导,证明了图片确实是衡量了 图片图片之间的差异。

图片

此时,最优的G:

图片

也就是使得图片最小的G

图片

图片时,表示两个分布完全相同。

对于图片 ,令 图片

我们该如何优化从而获得图片呢???

我们希望通过最小化损失函数L(G) ,找到最优的G。

这一步可以通过梯度下降实现:

图片

具体算法参考:

第一代:

  1. 给定图片(随机初始化)
  • 确定图片 使得 V(图片,D) 最大。此时 V(图片,图片) 表示图片图片的JS散度

  • 梯度下降:图片 .得到

    图片

第二代:

  1. 给定图片
  • 确定图片 使得V(图片,D) 最大。此时V(图片,图片)表示图片图片的JS散度

  • 梯度下降:图片 .得到

    图片

。。。

后面的依此类推

以上算法有一个问题: 如何确定图片使得 V (D ,G**)**** 最大???**

也就是:给定 G,如何计算 图片

回答:

图片采样图片

图片采样图片

因此我们可以将图片从期望值计算改写为对样本计算(近似估计):

图片

这很自然地让我们想到二分类问题中常使用的交叉熵loss

因此,我们不妨联想:

D是一个二分类器,参数图片

来自图片的采样图片作为正样本

来自图片的采样图片作为负样本

那么此时,我们就将问题转化成了一个二分类问题:

交叉熵loss大 -->图片图片 JS散度小

交叉熵loss小 -->图片图片 JS散度大

此时,D就是可以使用一个神经网络作为二分类器,那么确定D,也就是可以使用梯度下降来优化获得D的最终参数。

GAN的最终算法流程:

初始化参数图片(for D)和图片(for G)

对于训练的每一轮:

第一部分 学习优化判别器D:

  • 图片采样图片

  • 图片 采样

    图片

  • 通过生成器 图片获得生成样本

    图片

  • 梯度下降更新图片来最大化 :

    图片:

    图片

注:以上第一部分可以重复多次:此过程本质上是在测量两分布之间的JS散度

第二部分 学习优化生成器G:

  • 再从图片采样另一组图片
  • 梯度下降更新图片来最小化 : 图片:图片 .实际上图片第一项与G无关,梯度下降只需最小化图片即可。

注:以上过程仅一次

最后的话:

其实在GAN之前,就已经有Auto-Encoder,VAE这样的方法来使用神经网络做生成式任务了。

GAN的最大的创新就是在于非常精妙地引入了判别器,从样本的维度解决了衡量两个分布差异的问题。

这种生成器和判别器对抗学习的模式,也必将在各种生成式任务中发挥其巨大的威力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1948

    浏览量

    73712
  • 生成器
    +关注

    关注

    7

    文章

    317

    浏览量

    21058
  • 深度学习
    +关注

    关注

    73

    文章

    5507

    浏览量

    121300
收藏 人收藏

    评论

    相关推荐

    你知道XGBoost背后数学原理是什么吗?

    在第一种方法的基础上,每走过特定数量的台阶,都由韩梅梅去计算每一个台阶的损失函数值,并从中找出局部最小值,以免错过全局最小值。每次韩梅梅找到局部最小值,她就发个信号,这样李雷就永远不会走错路了。但这种方法对女孩子不公平,可怜的韩梅梅需要探索她附近的所有点并计算所有这些点的函数值。
    的头像 发表于 08-22 08:59 6.5w次阅读

    基于GaN的开关器件

    和电机控制中。他们的接受度和可信度正在逐渐提高。(请注意,基于GaN的射频功放或功放也取得了很大的成功,但与GaN器件具有不同的应用场合,超出了本文的范围。)本文探讨GaN器件的潜力
    发表于 06-21 08:27

    如何精确高效的完成GaN PA中的I-V曲线设计?

    GaN PA 设计?)后,了解I-V 曲线(亦称为电流-电压特性曲线)是一个很好的起点。本篇文章探讨I-V 曲线的重要性,及其在非线性GaN 模型(如Modelithics Qorvo GaN
    发表于 07-31 06:44

    推导GAN公式

    GAN数学推导和案例应用
    发表于 04-13 09:34

    GraphSAGEGNN算法的数学原理是什么?

    本文深入讨论了GraphSAGEGNN算法的数学原理,并从多个维度分析了GNN加速器设计中的技术挑战。
    发表于 06-17 08:56

    变压变频调速的数学原理是什么

    变压变频调速系统的基本原则是什么?变压变频调速的数学原理是什么?
    发表于 08-03 06:10

    dq坐标变换数学原理

    dq坐标变换数学原理
    发表于 12-20 22:56 19次下载

    深入卷积神经网络背后数学原理

    在计算机神经视觉技术的发展过程中,卷积神经网络成为了其中的重要组成部分,本文对卷积神经网络的数学原理进行了介绍。
    的头像 发表于 04-25 14:52 3568次阅读

    计算机代数系统数学原理

    本文主要讨论计算机代数系统的数学原理,由十六个章节组成。内容包含高精度运算,数论,数学常数,精确线性代数,多项式,方程求解,符号求和,符号积分,微分方程符号解等九大部分,涵盖了构建计算机代数系统的最基础也是最重要的内容。许多内容是第一次被系统地整理出现在中文文献中,一些领
    发表于 03-24 14:18 31次下载

    图解:卷积神经网络数学原理解析

    图解:卷积神经网络数学原理解析 源自:数学中国 过去我们已经知道被称为紧密连接的神经网络。这些网络的神经元被分成若干组,形成连续的层。每一个这样的神经元都与相邻层的每一个神经元相连。下图显示了这种
    的头像 发表于 09-16 10:01 1604次阅读
    图解:卷积神经网络<b class='flag-5'>数学原理</b>解析

    详解图神经网络的数学原理2

    。 本文将流行的图神经网络及其数学细微差别的进行详细的梳理和解释,图深度学习背后的思想是学习具有节点和边的图的结构和空间特征,这些节点和边表示实体及其交互。
    的头像 发表于 03-17 09:58 532次阅读
    详解图神经网络的<b class='flag-5'>数学原理</b>2

    详解图神经网络的数学原理3

    。 本文将流行的图神经网络及其数学细微差别的进行详细的梳理和解释,图深度学习背后的思想是学习具有节点和边的图的结构和空间特征,这些节点和边表示实体及其交互。
    的头像 发表于 03-17 09:58 945次阅读
    详解图神经网络的<b class='flag-5'>数学原理</b>3

    探讨GAN背后数学原理(上)

    GAN的风暴席卷了整个深度学习圈子,任何任务似乎套上GAN的壳子,立马就变得高大上了起来。那么,GAN究竟是什么呢? **GAN的主要应用目标:** 生成式任务(生成、重建
    的头像 发表于 03-17 10:01 489次阅读
    <b class='flag-5'>探讨</b><b class='flag-5'>GAN</b><b class='flag-5'>背后</b>的<b class='flag-5'>数学原理</b>(上)

    背后数学原理在应用中得到验证

    IEC 61508 和 ISO 26262 都提供“经过验证的使用”作为声明合规性的替代途径。在 IEC 61508 中,经使用验证的术语称为路由 2S.更常见的路线 1S表示该项目的开发符合标准的所有适用要求。路线 2S当该项目的开发不符合IEC 61508时,可以使用,但有很多操作经验可以表明其安全性。
    的头像 发表于 06-27 16:59 537次阅读
    <b class='flag-5'>背后</b>的<b class='flag-5'>数学原理</b>在应用中得到验证

    傅里叶变换的数学原理

    傅里叶变换的数学原理主要基于一种将函数分解为正弦和余弦函数(或复指数函数)的线性组合的思想。以下是对傅里叶变换数学原理的介绍: 一、基本原理 傅里叶级数 :对于周期性连续信号,可以将其表示为傅里叶
    的头像 发表于 11-14 09:27 599次阅读