0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于GAN先验的退化感知特征插值人脸修复网络

jf_pmFSk4VX 来源:GiantPandaCV 2023-02-23 11:43 次阅读

背景介绍

人脸修复是一种典型的ill-posed问题、可逆图像修复问题,其解不唯一且必存在。高度退化和多退化的场景下,高质量的人脸修复明显更具有挑战性。传统深度学习方法利用成对的数据集训练模型从而获得处理该退化问题的能力,这些普通范式虽然在全局人脸结构上有不错的效果,但是明显在修复结果的细节丰富度上并不理想。

因此,近一两年,顶会上出现了不少基于GAN先验特征的人脸修复方法。这些方法通过将退化的人脸图像编码到训练好的GAN网络的潜在空间中,利用隐藏在GAN网络中丰富的图像先验知识,来获得更好的人脸修复细节。但是,常见的GAN网络的latent features维度并不高,这些特征的空间表达能力也不佳,难以完整捕获退化人脸图像的面部结构,造成恢复结果的身份信息与原图并不一致,即方法结果的保真度较低。

为了进一步、更完整得捕获输入退化图像的面部特征,一些方法不仅将降质人脸图像编码到潜空间中,而且还将外部特征(例如从降质人脸图像中提取的特征)与 GAN 先验特征融合起来,以实现更好的身份一致性。然而,它们并没有提供明确的降质感知的特征融合设计,因此在面对不同的、多变的退化时,修复效果的鲁棒性并不理想。

受最近对比学习范式的启发,作者团队首先提出一种无监督的退化表征学习策略,旨在利用对比学习和视觉注意力的最新进展,预训练一个退化表示编码器(DRE)。DRE 提取输入退化人脸图像的退化表征,作为全局条件指导恢复过程。此外,作者还提出了一种新的退化感知特征插值(DAFI)模块,可以根据退化表征动态融合 GAN 先验特征和从退化人脸图像中提取的特征。

作者团队进一步提出了一种新的网络,以集成这些设计用于人脸修复任务。由于选择和融合不同来源的特征的思路类似于制作 panini (帕尼尼,KFC早餐经典食品)的方式,因此将这个网络称为 Panini-Net。该网络可以根据退化程度动态调整融合的特征比例,以实现更好的修复性能。

方法介绍

下面将逐一介绍Panini-Net的各个模块,最后将总结该方法的重点内容。

ff4fc592-b329-11ed-bfe3-dac502259ad0.png

Panini-Net架构图。它由图像特征提取模块(Image Feature Extraction Module)、退化感知特征插值模块组成(DAFI) 模块,以预训练的 StyleGAN2 作为 GAN Prior 模块 (GPM)。给定退化的人脸图像作为输入,图像特征提取模块提取特征,并预测latent code,该latent code可以从 GPM 中粗略地获取类似的高质量人脸。然后,使用 DAFI 块逐步对特征做插值处理从而合并退化人脸图像的有效结构信息。预训练的退化表示编码器 (DRE) 将退化表示编码为向量,其可以被视为指导 DAFI 块进行恢复的全局条件。

GAN Prior Module

Panini-Net采用预训练的StyleGAN2的生成器来作为GAN先验模块,如上图中所示,该模块从一个可学习的常量特征开始,逐渐通过一系列的GAN blocks来生成分层的高质量特征图,从而将其配合退化感知特征插值模块,通过动态的特征融合来矫正面部结构。

Unsupervised Degradation Representation Learning for Degradation Representation

ff7ea22c-b329-11ed-bfe3-dac502259ad0.png

退化表示的无监督退化表示学习策略。对于每次迭代,随机生成一组新的退化参数,并在两个高质量图像上操作它们从而得到不同的新 HQ 图像生成正例对。让队列中的历史图像成为反例,以鼓励学习退化而不是内容。

无监督表征学习(Unsupervised Degradation Representation Learning )用于图像修复(超分)其实不是一个比较新的idea,之前cvpr‘21的超分工作DASR,以及cvpr’22的AirNet都有类似的范式来作为方案的核心。不过在Panini-Net中,该部分还是挺不一样的。

具体来说,如上图所示,先在两个不同的高质量人脸图像上应用同一组退化参数来得到两个内容不同、退化模式不同的退化图像,随后利用MoCo范式来执行对比学习,所利用的约束也是常见的InfoNCE loss,从而鼓励学习退化而不是内容。cvpr‘21的超分工作DASR,以及cvpr’22的AirNet的论文名字:Unsupervised Degradation Representation Learning for Blind Super-Resolution (CVPR'21)All-in-one image restoration for unknown corruption (CVPR'22)

Degradation-aware Feature Interpolation (DAFI) block

ffa5d50e-b329-11ed-bfe3-dac502259ad0.png

退化感知特征插值 (DAFI) 块,无监督退化特征学习方式训练得到的encdoer从退化图像中抽取出V_{DR}作为退化的判别表征,该表征可以作为一种“condition”来生成自适应的channel-wise mask。可以从上图中看出,mask由一个mlp子网络和softmax来生成。这个mask 将用于动态特征插值从而辅助特征的融合。

在获得退化的判别表征后,Panini-Net将其作为一个全局的退化“condition”从而指导退化修复,具体来说,通过如上图所示的mask,该mask的size为:,即channel-wise的形式。将每个mask元素用于对应的融合特征通道的插值权重。通过如下插值公式,来利用该mask来灵活的动态融合不同特征:

其中表示channel-wise上的点积。

实验分析&视觉效果对比

ffd90a0a-b329-11ed-bfe3-dac502259ad0.png

16xSR设定下的视觉对比图,可以看到PaniniNet很好的修复了退化图像的细节信息,保真度也非常不错。

00083294-b32a-11ed-bfe3-dac502259ad0.png

消融实验

作者在正文消融实验部分重点探讨了利用DAFI模块作为fusion操作的增益,并对Panini-Net的关键超参做了剖析。对fusion操作的探讨,主要是和直接利用concat+conv来fusion的常见操作做了对比,模型剖析部分则重点关注退化水平与插值比率的超参关系。

作者发现DAFI模块可以更好的保留GAN先验特征中的细节信息,而global condition guidance可以帮助DAFI更好的去fusion特征。当退化严重时,Panini-Net可以动态增加GAN-Prior的使用比例。

结论

这篇论文重点关注如何更好的引入GAN Prior从而帮助人脸图像修复问题,作者通过无监督表征学习和结合mask策略的插值(特征融合)模块来将GAN prior动态的引入到修复网络中,实现了非常不错的修复效果。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3664

    浏览量

    135146
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1964

    浏览量

    74089
  • 图像编码
    +关注

    关注

    0

    文章

    26

    浏览量

    8353

原文标题:AAAI'22 | Panini-Net | 基于GAN先验的退化感知特征插值人脸修复网络

文章出处:【微信号:GiantPandaCV,微信公众号:GiantPandaCV】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于贝叶斯分类器和径向基函数(RBF)网络融合的人脸识别方法的设计方案

    基于贝叶斯分类器和RBF神经网络融合的人脸识别方法的设计方案 本文基于人脸图像分块和奇异压缩,进行RBF 神经网络和贝叶斯分类器融合的设计
    发表于 10-23 10:03

    图像的深浅特征应用于人脸识别

    本文将HOG特征和PCANet网络提取的特征进行融合,不仅包含数据的浅层局部和数据分布信息,还包含深度判别性信息,在AR及Yale B人脸数据库的实验结果验证了本文算法的有效性和鲁棒性
    发表于 11-25 06:17

    GaN的极性特征测量及应用

    GaN的极性特征测量及应用: GaN 在(0001) 方向是一种极性极强的半导体材料,它具有极强的表面特征,是目前发现的最好的压电材料,而GaN
    发表于 01-02 14:15 10次下载

    基于空间连续性方向的图像修复算法

    基于空间连续性方向的图像修复算法
    发表于 08-03 17:01 0次下载

    先验置信传播的图像修复算法

    先验置信传播( priority-BP)算法很难在实际中达到实时处理的要求,计算效率也有很大的提升空间。针对先验BP算法在图像修复上的应用,改进算法主要在信息传递以及标签搜索方面提出改进措施。在信息
    发表于 12-21 09:26 0次下载
    <b class='flag-5'>先验</b>置信传播的图像<b class='flag-5'>修复</b>算法

    基于深度神经网络特征加权融合人脸识别方法DLWF

    针对目前难以提取到适合用于分类的人脸特征以及在非限条件下进行人脸识别准确率低的问题,提出了一种基于深度神经网络特征加权融合
    发表于 12-23 11:42 2次下载

    无线传感网络缺失估计方法

    ,提出了基于感知数据属性的数据交织传送策略。仿真结果表明,所提出的估计方法能有效估计无线传感器网络中的缺失,相比基于时空相关性的线性插值模型( LM)算法和传统的最近邻
    发表于 12-27 16:56 0次下载

    基于接收信号样本协方差矩阵最小特征值分布的频谱感知算法

    现有的频谱感知算法中,能量检测容易实现,但检测性能依赖噪声功率。基于随机矩阵理论的频谱感知算法巧妙地规避了噪声不确定性对检测性能带来的影响,但大都采用的是最大特征值的近似分布规律,所得到阈值表达式
    发表于 01-16 10:54 0次下载

    基于先验约束和统计的图像修复算法

    匹配和算法的时效性两个方面进行改进,提出新的图像修复算法。在样本块精确匹配方面,改进算法对图像进行预处理以获得图像的先验信息,并利用先验信息约束算法偏移映射图的初始化,从而转变PatchMatch算法中对图像偏移映射图的全局随机
    发表于 03-29 17:42 4次下载

    AlGaN和GaN HEMT在不同温度下的退化规律及退化机理详细说明

    基于温度步进应力实验,研究了 AlGaN /GaN HEMT 器件在不同温度应力下的退化规律及退化机理。实验发现: 在结温为 139 ~ 200 ℃ 时,AlGaN /GaN HEMT
    发表于 06-23 08:00 6次下载
    AlGaN和<b class='flag-5'>GaN</b> HEMT在不同温度下的<b class='flag-5'>退化</b>规律及<b class='flag-5'>退化</b>机理详细说明

    一种结合边缘信息的门卷积的人脸修复算法

    卷积在部分像素缺失下的精确局部特征描述能力,设计面向图像修复的门卷积深度生成对抗网络GAN)。该模型由边缘连接生成对抗网络和图像
    发表于 04-02 15:21 7次下载
    一种结合边缘信息的门卷积的<b class='flag-5'>人脸</b><b class='flag-5'>修复</b>算法

    基于GAN-inversion的图像重构过程

    笔者最近在集中时间学习对抗生成网络GAN),特别是深度生成先验进行多用途图像修复与处理,需要对图像修复与处理经典论文进行回顾和精读。
    的头像 发表于 07-13 14:19 3070次阅读

    基于矢量量化字典与双解码器的人脸修复网络

    尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。
    的头像 发表于 03-08 09:50 1082次阅读

    DCNN网络结构 DCNN的人脸特征点检测

    摘 要:在介绍人脸特征点检测的理论知识的基础上,提出了一种基于深层卷积神经网络(Deep ConvolutionalNeural Network,DCNN)解决人脸5点
    发表于 07-20 14:30 0次下载

    如何设计人脸识别的神经网络

    人脸识别技术是一种基于人脸特征信息进行身份识别的技术,广泛应用于安全监控、身份认证、智能门禁等领域。神经网络是实现人脸识别的关键技术之一,本
    的头像 发表于 07-04 09:20 731次阅读