0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nirkin提出单编码器 - 多解码器网络架构和算法对换脸质量的影响

lhl545545 来源:EDA365 作者:EDA365 2020-09-14 10:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

迪士尼新研究实现百万像素图像和视频换脸,说不定未来大荧幕电影也会使用换脸技术了。

deepfakes 技术可以用于图像和视频换脸,但它能否用于大制作电影和电视节目中呢?迪士尼最新放出的一则视频 demo 展示了这种可能性。

近日迪士尼在欧洲图形学会透视研讨会(EGSR)上发表研究,展示了首个百万像素逼真换脸技术。

效果是不是还不错。这样的效果虽然并不足以用于漫威电影,但它是换脸技术迈出的新一步。

来自迪士尼的研究者表示,这项技术的创新点在于能够达到百万像素质量。百万像素或许不再是高质量图像的代名词,毕竟手机自带摄像头就能达到千万像素。但是截至目前,换脸技术一直注重平滑的面部转换,不注重提高像素。

你可能在手机上看到过效果好到爆炸的换脸视频,但是如果把它们放在更大的屏幕上呈现,就会出现很多瑕疵。研究者表示,他们用开源 deepfake 模型 DeepFakeLab 创建的视频分辨率最高也只有 256*256 像素。相比之下,迪士尼新模型能够让视频的分辨率提升到 1024*1024 像素。

那么,百万像素换脸是如何实现的呢?

首个百万像素换脸方法

迪士尼的这项研究发表在欧洲图形学会透视研讨会(EGSR)上,提出了一种在图像和视频中实现全自动换脸的算法。据研究者称,这是首个渲染百万像素逼真结果的方法,且输出结果具备时序一致性。

具体来说,该研究提出了一个渐进式训练的多路 comb 网络,以及一种保持亮度和对比度的混合方法。

具体而言,虽然渐进式训练能够生成高分辨率图像,但将架构和训练数据扩展至两人以上可以使生成的表情具备更高的保真度。

此外,在将生成的表情合成到目标人脸时,研究者调整混合策略,以保持对比度和低频光照。

最后,研究者在人脸关键点稳定算法中融入了一种细化策略,以实现时序稳定性,这对于处理高分辨率视频来说至关重要。

在实验部分,研究者通过控制变量研究来验证该方法对换脸质量的影响,并与流行的 SOTA 方法进行了比较。

百万像素分辨率下执行逼真换脸的整体流程:

该流程包括如下四个步骤:

对于图像 x_t,检测人脸并定位人脸关键点;

将人脸分辨率归一化为 1024×1024,保存归一化参数;

将归一化人脸馈入网络,并保存第 s 个解码器的输出 x?_s;

使用步骤 2 保存的归一化参数,在图像 x?_s 上反转图像归一化结果。最后,借助该研究提出的合成方法,将生成的图像与图像 x_t 混合。

而该流程中,最核心的组件无疑是模型本身了。该研究使用的单编码器 - 多解码器网络架构:

此外,研究者还介绍了实现人脸关键点对齐和稳定的方法,以确保换脸图像的时序一致性,以及保持光照和对比度的图像合成流程。此处不再赘述,详情参见原论文。

与当前 SOTA 方法的对比

该方法与 DeepFakes、DeepFaceLab 和 Nirkin 等人提出方法的换脸效果对比。从左到右依次为:目标图像、源图像、该方法在 1024×1024 和 256×256 分辨率下的成像效果,以及其他三种方法的成像效果。

控制变量研究

研究者执行以下四种实验,来查看该研究提出的单编码器 - 多解码器网络架构和算法对换脸质量的影响:

渐进式训练 VS 一次性训练整个网络;

使用多路 comb 模型 VS 单独的双路模型;

该研究提出的保持对比度的多频段合成方法 VS 泊松融合方法;

该研究中人脸关键点稳定方法的影响。

为渐进式训练与非渐进式训练的成像效果对比,可以看出,渐进式训练的成像效果优于非渐进式训练。

为使用多路 comb 模型与双路模型的成像效果对比:

方法与泊松融合方法的成像效果对比。从图中可以看出,该方法可以更好地保留目标人脸的全局光照特征,而泊松融合方法导致人脸出现了某种「漂白」效果。

人脸关键点稳定结果:

缺陷

尽管能够以高分辨率进行逼真的人脸转换,但是迪士尼提出的这一方法仍然存在缺陷。例如,无法基于数据恰当捕获的表情和姿势,可能会导致不完善的生成结果,比如模糊和其它伪影。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1225

    浏览量

    43753
  • 编码器
    +关注

    关注

    45

    文章

    4009

    浏览量

    143306
  • 数据
    +关注

    关注

    8

    文章

    7347

    浏览量

    95004
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深入剖析AD1938:高性能音频编解码器的技术奥秘

    深入剖析AD1938的特点、性能及应用。 文件下载: AD1938.pdf 一、AD1938概述 AD1938是一款高性能芯片编解码器,集成了四个模拟 - 数字转换(ADC)和八个数字 - 模拟转换
    的头像 发表于 04-18 14:50 76次阅读

    探秘RF803系列编码器/解码器IC:开启远程控制新视界

    探秘RF803系列编码器/解码器IC:开启远程控制新视界 在电子工程师的设计世界里,远程控制系统的开发是一个充满挑战与机遇的领域。而RF803系列编码器/解码器IC,无疑是这个领域中的
    的头像 发表于 04-14 12:45 179次阅读

    RF600E与RF600D:编码器解码器芯片组的卓越之选

    RF600E与RF600D:编码器解码器芯片组的卓越之选 在电子设备的世界里,远程控制和数据传输是不可或缺的功能。而RF600E和RF600D这对编码器解码器芯片组,为我们提供了一
    的头像 发表于 04-14 12:40 151次阅读

    磁铁在编码器中的作用与应用

    编码器中,磁铁的作用不可小觑,常用的磁性材料主要是钕铁硼和铁氧体,今天这篇文章主要介绍下磁铁用于哪些编码器类型,以及其具体作用。磁铁在编码器中的作用(功能)是什么?在编码器中,磁铁主
    的头像 发表于 03-19 14:42 335次阅读
    磁铁在<b class='flag-5'>编码器</b>中的作用与应用

    麦歌恩磁编码器芯片INL≤±0.07°高精度角度解算算法研究 -艾毕胜电子

    恩磁编码器通过硬件架构优化+信号预处理+CORDIC核心解算+多级误差补偿的全链路算法体系,成功将INL优化至≤±0.07°(典型值),实现了与顶级光电编码器相当的精度水平,同时保留了
    的头像 发表于 03-18 15:33 177次阅读

    非接触式磁场传感:磁性编码器信号生成与解码原理

    四类传感单元的信号生成差异,以及基于反正切、CORDIC、插值细分与误差补偿的解码算法。通过对信号生成质量解码精度的内在关联进行研究,揭示非接触磁场传感的性能边界与优化方向,为高性
    的头像 发表于 03-05 16:09 331次阅读
    非接触式磁场传感:磁性<b class='flag-5'>编码器</b>信号生成与<b class='flag-5'>解码</b>原理

    编码器:解锁未来科技的“双核密码”

    在人工智能与数据处理技术狂飙突进的时代,数据的高效处理与精准解析已成为企业竞争力的核心。当传统编码器逐渐触及性能天花板, 双编码器架构 正以“双核驱动”的颠覆性优势,重新定义数据处理
    的头像 发表于 03-05 08:39 490次阅读
    双<b class='flag-5'>编码器</b>:解锁未来科技的“双核密码”

    MCP2120红外编码器/解码器:特性、应用与设计要点

    MCP2120红外编码器/解码器:特性、应用与设计要点 在电子设计领域,红外通信技术凭借其低成本、高可靠性等优势,在众多应用场景中得到了广泛应用。Microchip的MCP2120红外编码器/
    的头像 发表于 02-04 16:05 429次阅读

    深入剖析LM4549B:高性能音频编解码器的技术指南

    深入剖析LM4549B:高性能音频编解码器的技术指南 在当今的音频处理领域,高性能的音频编解码器对于实现出色的音频质量至关重要。LM4549B作为一款专为PC系统设计的音频编解码器,以
    的头像 发表于 02-03 10:50 362次阅读

    增强T-BOX设计,新唐编解码器的重要作用

    、远程异常维护和更新。 数据收集和传输:安全保护和隐私加密。 多接口扩展:可定制的功能和软件应用程序。 在T-BOX中,编解码器编码器-解码器)起着至关重要的作用,充当主要的通信桥梁。其基本功能包括
    发表于 09-05 06:26

    绝对值编码器与增量式编码器相比有哪些优势?

    绝对值编码器与增量式编码器相比有哪些优势?核心功能:断电后位置信息不丢失,绝对值编码器:通过机械结构或电子存储(如电池备份),能实时输出当前位置的唯一绝对值编码(如二进制、格雷码)。无
    的头像 发表于 08-11 13:57 2010次阅读
    绝对值<b class='flag-5'>编码器</b>与增量式<b class='flag-5'>编码器</b>相比有哪些优势?

    宜科电子推出适用于电机运动控制的正余弦编码器

    正余弦信号编码器(Sin/Cos编码器)是一种特殊的增量式编码器,其核心特点是输出‌高质量的正弦波和余弦波模拟信号‌。区别于传统增量编码器
    的头像 发表于 07-29 11:40 1481次阅读

    Transformer架构解码器的工作流程

    解码器的作用主要是制作文本序列。与编码器类似,解码器也配备了一组类似的子层。它具有两个Multi-Head attention层,一个点前馈层,并且在每个子层之后都包含剩余连接和层归一化。
    的头像 发表于 06-10 14:32 1358次阅读
    Transformer<b class='flag-5'>架构</b>中<b class='flag-5'>解码器</b>的工作流程

    Transformer架构编码器的工作流程

    编码器是Transformer体系结构的基本组件。编码器的主要功能是将输入标记转换为上下文表示。与早期独立处理token的模型不同,Transformer编码器根据整个序列捕获每个token的上下文。
    的头像 发表于 06-10 14:27 1199次阅读
    Transformer<b class='flag-5'>架构</b>中<b class='flag-5'>编码器</b>的工作流程

    TWL6040 用于便携式应用的 8 通道高质量低功耗音频编解码器数据手册

    TWL6040 设备是具有高集成度的音频编码器/解码器(编解码器),可为便携式应用程序提供模拟音频编解码器功能,如 所示。该设备包含多个音频模拟输入和输出,以及麦克风偏置和附件检测。该
    的头像 发表于 04-27 17:52 1202次阅读
    TWL6040 用于便携式应用的 8 通道高<b class='flag-5'>质量</b>低功耗音频编<b class='flag-5'>解码器</b>数据手册