0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于泊松方程的生成模型 PFGM

OpenCV学堂 来源:OpenCV学堂 作者:OpenCV学堂 2022-10-20 09:22 次阅读

引言

扩散模型最早来源于物理中的热力学,最近却在人工智能领域大放异彩。还有什么物理理论可以推动生成模型研究的发展呢?最近,来自 MIT 的研究者受到高维电磁理论的启发,提出了一种称作泊松流(Poisson Flow)的生成模型。理论上,这种模型具有直观的图像和严谨的理论;实验上,它在生成质量、生成速度和鲁棒性上往往比扩散模型更好。

受到静电力学的启发,研究人员提出了一种新的生成模型,名为泊松流模型 (Poisson Flow Generative Models, or PFGM)。直观上,该研究可以把 N 维的数据点看成在 N+1 维空间中新增维度 z=0 平面上的一群正电荷,它们产生了高维空间中的电场。从 z=0 平面开始沿着它们产生的电场线往外走,该研究能够把样本送到一个半球面上(如图一所示)。这些电场线的方向对应于高维空间中泊松方程 (Poisson Equation)的解的梯度。研究人员证明了当半球的半径足够大的时候,电场线能够把在 z=0 平面上的电荷分布(也就是数据分布)转换为一个在半球面上的均匀分布(图二)。

PFGM 利用了电场线的可逆性来生成 z=0 平面上的数据分布:首先研究人员在大的半球面上均匀采样,接着让样本沿着电场线从球面往 z=0 平面运动,从而生成数据。由于沿着电场线的运动可以由一个常微分方程(ODE)描述,因此在实际的采样中研究人员只需要解一个由电场线方向决定的 ODE。通过电场,PFGM 将一个球面上的简单分布转换为一个复杂的数据分布。从这个角度来看,PFGM 可以被认为是一种连续的标准化流(Normalizing Flow)。

在图像生成实验中,PFGM 是当前在标准数据集 CIFAR-10 上表现最好的标准化流模型,取得了 2.35 的 FID score (图片质量的度量)。研究人员也展示了 PFGM 的其他一些用途,比如它能够计算图片的似然 (likelihood)、进行图片编辑和扩展到高分辨率的图片数据集上。此外,研究人员发现 PFGM 比近期大热的扩散模型 (Diffusion Models)有着三个优点

(1)在相同的网络结构上,PFGM 的 ODE 生成的样本质量远好于扩散模型的 ODE;(2)在与扩散模型的 SDE (随机微分方程)生成质量差不多的情况下,PFGM 的 ODE 达到了 10 倍 - 20 倍的加速;

(3)PFGM 在表达能力更弱的网络结构上比扩散模型鲁棒。

734a16ca-4fd2-11ed-a3b6-dac502259ad0.gif

73b34398-4fd2-11ed-a3b6-dac502259ad0.gif

图一:样本点沿着电场线运动 。上图:数据分布呈爱心状;下图:数据分布呈 PFGM 状

73fa5b84-4fd2-11ed-a3b6-dac502259ad0.png

图二:左图:泊松场在三维中的轨迹;右图:在图像上使用 PFGM 的前向 ODE 和反向 ODE

方法概览

注意到上述的过程将 N 维数据嵌入到了在 N+1 维(多了 z 维度)的空间中。为了方便区分,研究人员把 N 维数据和 N+1 维用 x 和740fd6ee-4fd2-11ed-a3b6-dac502259ad0.png表示。为了得到上述的高维电场线,需要解如下的泊松方程:

741ffc90-4fd2-11ed-a3b6-dac502259ad0.png

其中74308916-4fd2-11ed-a3b6-dac502259ad0.png是位于 z=0 平面上想要生成的数据分布;743bb00c-4fd2-11ed-a3b6-dac502259ad0.png是势函数,也就是研究人员求解的目标。由于只需要知道电场线的方向,研究人员推导出了电场线的梯度(势函数的梯度)的解析形式:

74478206-4fd2-11ed-a3b6-dac502259ad0.png

电场线的轨迹(见图二)能够被下面的 ODE 所描述:

7454de06-4fd2-11ed-a3b6-dac502259ad0.png

在下面的定理中,研究人员证明了上述 ODE 定义了一个高维半球面上的均匀分布和 z=0 平面上的数据分布的双射。这个结论与图一、图二的直观相同:可以通过电场线来还原数据分布。

745fc0f0-4fd2-11ed-a3b6-dac502259ad0.png

PFGM 的训练

给定一个从数据分布中采样得到数据集746f7072-4fd2-11ed-a3b6-dac502259ad0.png,研究人员用该数据集所对应的电场线梯度,来近似数据分布所对应的电场线梯度:

74801260-4fd2-11ed-a3b6-dac502259ad0.png

该电场线梯度是学习目标。该研究通过 perturb 函数在空间中进行选点,并且平方损失函数让神经网络748cc136-4fd2-11ed-a3b6-dac502259ad0.png去学习空间中归一化的电场线梯度74998a38-4fd2-11ed-a3b6-dac502259ad0.png, 具体算法如下:

74a62e64-4fd2-11ed-a3b6-dac502259ad0.png

PFGM 的采样

当学习完归一化去学习空间中归一化的电场线梯度74be74b0-4fd2-11ed-a3b6-dac502259ad0.png后,可以通过如下的 ODE 对数据分布进行采样:

74ce2e14-4fd2-11ed-a3b6-dac502259ad0.png

该 ODE 通过减小 z,使得样本从大球面沿着电场线逐渐运动到 z=0 平面。此外,该研究提出了将大球面上的均匀分布投影到某个 z 平面以方便 ODE 模拟,并进一步通过变量替换来进一步加速采样。具体步骤请参见文章的 3.3 节。

实验结果

在表一中,该研究使用标准数据集 CIFAR-10 来评估不同模型。在该数据集上,PFGM 是表现最好的可逆标准化流模型,取得了 2.35 的 FID score。在使用相同的网络结构 (DDPM++/DDPM++ deep) 的条件下,PFGM 的表现优于扩散模型。研究人员同时观测到,在与扩散模型的 SDE (随机微分方程)生成质量差不多的情况下,PFGM 达到了 10 倍 - 20 倍的加速,更好地兼顾了生成质量与速度。此外,研究人员发现 PFGM 在表达能力更弱的网络结构上比扩散模型鲁棒,并且在更高维的数据集上依然优于同等条件下的扩散模型。具体请见文章的实验章节。在图三中,该研究可视化了 PFGM 生成图片的过程。

74d99e3e-4fd2-11ed-a3b6-dac502259ad0.png

表一:CIFAR-10 数据上的样本质量(FID, Inception)与采样步数 (NFE)

74e859ce-4fd2-11ed-a3b6-dac502259ad0.gif

75e6b1e0-4fd2-11ed-a3b6-dac502259ad0.gif

769b66e4-4fd2-11ed-a3b6-dac502259ad0.gif

图三:PFGM 在 CIFAR-10, CelebA 64x64, LSUN bedroom 256x256 上的采样过程

结论

该研究提出了一个基于泊松方程的生成模型 PFGM。这个模型预测 N+1 维的扩展空间中的归一化电场线梯度,并通过电场线对应的 ODE 来采样。实验中,该研究的模型是当前最好的标准化流模型,并在相同的网络结构上取得了比扩散模型更好的生成效果与更快的采样速度。PFGM 的采样过程对噪声更鲁棒,也能扩展到更高维的数据集中。研究人员期望 PFGM 能够在其他应用领域中也能取得亮眼表现,比如分子生成和 3D 数据生成。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7134

    浏览量

    89533
  • 人工智能
    +关注

    关注

    1796

    文章

    47643

    浏览量

    240174
  • 模型
    +关注

    关注

    1

    文章

    3298

    浏览量

    49188

原文标题:卷!MIT泊松流生成模型击败扩散模型,兼顾质量与速度

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Matlab偏微分方程工具箱应用说明

    hyperbolic 求解双曲线型偏微分方程parabolic 求解抛物线型偏微分方程pdeeig 求解特征型偏微分方程pdenonlin 求解非线性型微分方程poisolv 利用矩阵
    发表于 09-22 15:26

    电子学领域的基本电磁定律,归纳/总结/点评

    高斯定理3.发拉弟定律4.安培定律4个定律+3个本构关系(E,D,H,B,J,E)得到麦克斯维方程组。说这个的书太多,公式什么的自己找,略。二级定律:1.标量和拉普拉斯方程2.矢量
    发表于 07-17 16:13

    计算机Fortran编程实现偏微分方程拉普拉斯变换

    。 这一特性用于通道二极管以达到层的宽度在次数10**-6厘米(cm),通过重的掺杂于普通的p-n节比较的次数10**-4cm。我们刚刚演示了方程应用的例子,包含解答一个已知电荷分布的势能分布。
    发表于 08-14 20:38

    根据转矩方程搭建速度环矢量模型

    爱自己是一生浪漫的开始。  电机控制中,无论什么观测器,最终都是为了得到电机的电角度跟角速度,这里就通过转矩方程来进行简单的速度环矢量控制模型。  目标:搭建简单的由转矩方程计算角度速度的矢量
    发表于 06-28 10:08

    五点差分格式求解方程并行算法的研究

    以二维静电场方程数值求解的串行算法(雅可比迭代、超松弛迭代)为基础,提出了五点差分格式超松弛迭代(SOR)求解二维静电场
    发表于 11-20 12:05 30次下载

    基于FBM模型的自相似流量建模仿真

    网络流量建模是网络规划与性能评价的重要基础,传统的业务模型大多基于模型和马尔可夫排队模型,只具有短程相关性,随着网络业务的不断研究发现,
    发表于 09-09 12:06 0次下载
    基于FBM<b class='flag-5'>模型</b>的自相似流量建模仿真

    内调制光电探测器光生电压的模型分析

    针对栅压内调制光电探测器耦合区的影响,以及横向发生的抽取效应对受光结的影响,从描述探测器的方程、电流方程和连续性方程出发,通过计算输出电
    发表于 11-11 11:06 40次下载
    内调制光电探测器光生电压的<b class='flag-5'>模型</b>分析

    量子点接触器件电势准3D数值模型和模拟方法

    采用三维方程和二维薛定谔方程自洽求解方法,建立量子点接触器件(QPC)内的电势分布和二维电子气层的电子密度分布的准三维模型及模拟方法,并
    发表于 02-27 11:07 35次下载
    量子点接触器件电势准3D数值<b class='flag-5'>模型</b>和模拟方法

    三维方程并行求解算法

    方程的数值解法在许多物理或者工程问题上得到广泛应用,但是由于大部分三维方程的离散化格式不
    发表于 11-17 17:27 16次下载

    机器学习:分布与指数分布

    统计概念其实容易理解多了。 我举一个例子,什么是分布和指数分布?恐怕大多数人都说不清楚。 我可以在10分钟内,让你毫不费力地理解这两个概念。一句话总结:分布是单位时间内独立事件
    发表于 11-29 03:44 4603次阅读

    基于簇过程的毫米波异构网络模型

    针对大规模热点通信场景中用户设备(UE)和基站空间的相关性描述问题,构建基于簇过程的毫米波异构网络模型,并提岀一种基于微微基站(PBS)最近距离比的UE簇分类方案。根据毫米波传输模型
    发表于 03-17 10:39 14次下载
    基于<b class='flag-5'>泊</b><b class='flag-5'>松</b>簇过程的毫米波异构网络<b class='flag-5'>模型</b>

    光的波动性之亮斑介绍

    当单色光照射在直径恰当的小圆板或圆珠时,会在之后的光屏上出现环状的互为同心圆的衍射条纹,并且在所有同心圆的圆心处会出现一个极小的亮斑,这个亮斑就被称为亮斑。
    发表于 11-14 15:33 1.5w次阅读

    方程的解法,聊到图像融合

    随着h->0,上面的微分算式的结果会逐渐逼近真实的微分值。对于图像而言,这里 h 最小可分割单元是像素,也就表示像素间的间距,可视为 1。再看看,二阶微分的公式,是不是可以看成 1x3 的卷积核 [1,-2,1] 在一维数组上进行卷积计算的结果(卷积中心在 x 上)。
    的头像 发表于 02-17 10:02 1934次阅读

    PCL盘采样具体流程

    盘采样 盘采样(possion disk sampling)的特点是任何两个点的距离都不会隔得太近。 比如下图,左边是随机生成的点,
    的头像 发表于 11-21 17:42 1405次阅读
    PCL<b class='flag-5'>泊</b><b class='flag-5'>松</b>盘采样具体流程

    深入解析SPICE模型系列的半导体器件

    半导体器件物理模型是指基于半导体器件物理的基本理论及器件的结构特性来计算器件的电学等行为,通常需要求解方程、电流连续性方程、复合
    的头像 发表于 04-29 16:18 2841次阅读
    深入解析SPICE<b class='flag-5'>模型</b>系列的半导体器件