0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于解剖学上的肌肉运动方式,提出了一种转换表情的新方法

zhKF_jqr_AI 来源:未知 作者:李倩 2018-07-31 09:24 次阅读

编者按:说到GAN在人脸上的应用,就不得不提起去年高丽大学、Clova AI Research、新泽西大学和香港科技大学共同发表的一项成果:一个可以在多域图像间实现图对图转换的统一生成对抗网络——StarGAN。它不仅能调整图像中的发色、肌理、肤色、性别,还能合成各种生动有趣的表情。而就在上周,美国的一群研究人员基于解剖学上的肌肉运动方式,提出了一种转换表情的新方法。

近年来,生成对抗网络(GAN)已经在面部表情合成任务中取得了令人印象深刻的结果,这为包括电影工业、摄影、时尚和电子商务在内的商业领域打开了一扇新大门:如果GAN真的能实现表情的自然转换,企业、制片方不仅能进一步压缩成本,还能加快产品的产出效率。

在这个背景下,去年提出的StarGAN无疑是目前最成功的架构,它只用一对生成器和判别器就能实现多个域之间的映射,且能对各个域的图像进行有效训练。虽然论文较以往成果有巨大进步,也显示出了通用性,但它只是把以前的2个域扩展到现在的k个域,模型转换效果还是受数据集注释局限。

为了解决这个问题,近日,西班牙IRI和美国俄亥俄州立大学的研究人员提出了一种基于动作单元(AU)的新型GAN,它在连续流形中描述了解剖学意义上的人类面部表情。经过无监督训练后,只需控制每个AU的激活程度,并选取其中几个进行组合,模型就能实现生动形象的表情转换。

模型架构和方法

首先,我们来看这个GAN的具体构造。

对于任意表情,模型把输入的RGB图像定义为Iyr∈RH×W×3。通过把复杂表情解构成一个个动作单元(AU),我们可以用一组N个AU yr= (y1, . . . , yN)T对每个表情编码,其中yn已经经过归一化处理,取值在0到1之间。有了这种连续表征,我们就可以在不同表征之间进行自然插值,从而渲染各种逼真、平滑的面部表情。

简而言之,我们的目标是学习一个映射M,它能把输入图像Iyr转换成基于目标AU yg的输出图像Iyg。

上图是GANimation的整体架构,可以发现,它主要由两部分组成:一个生成器G,一个判别器D。其中生成器负责回归注意力(GI)和生成色彩掩模(GA),判别器负责鉴别生成图像逼真与否(DI),并检查表情是否连贯(yˆg)。

既然重点是AU,那么模型的一个关键自然是专注于图像中那些负责合成新表情的区域,换言之,我们需要弱化头发、眼镜、帽子或珠宝等其他元素对模型的干扰。为了实现这一点,如上图所示,研究人员在生成器中引入注意力机制,把输入图像分成注意力掩模A和RGB掩模C,完成表情转换后再合并渲染。

什么是AU

关于什么是AU,文中并没有仔细说明,所以这里我们来看它重点引用的另一篇论文。

这篇名为Compound facial expressions of emotion的论文来自俄亥俄州立大学哥伦布分校,它和GANimation有一个共同的作者:Aleix M. Martinez。根据他们的研究,人类的不同面部表情可能存在一定相关性,比如当一个人感到惊喜时,他的面部肌肉群运动其实结合了愉悦、惊讶两种基础情绪的肌肉运动方式。

基于这个发现,他们提出了一种名为复合情感类别的重要表达式。通过采集230名人类受试者的面部表情样本图像,并进行观察实验,最终他们定义了21种不同表情类别,其中的差异可以被计算机用来区分不同人类情感。

数据库中的22种常见表情

用线条进行肌肉运动分析

六种复合面部表情的AU组成

很可惜,仔细浏览了论文好几次,我还是没能从中找出AU对照表。下表是目前已知的几项内容:

不过不知道也没关系,这个GAN已经公开了自己的pytorch实现:github.com/albertpumarola/GANimation。如果有读者希望获得完整表格,建议直接联系作者,或者依照俄亥俄州立大学论文中的方法自己总结,里面详尽列出了数据来源、具体方法和操作细节。

实验

最后是实验对比,我们先来看看GANimation和DIAT、CycleGAN、IcGAN、StarGAN这些模型的性能区别。

如下图所示,前三种模型都出现了不同程度的扭曲和畸变,表现较差;而StarGAN虽然保留了更多人脸细节,生成表情也更自然,但牺牲了清晰度,输出图像比较模糊。相比之下,GANimation虽然在脸型上出现了一点小瑕疵,但它的综合表现是最好的。

下图是GANimation的一些成功和失败的例子。其中前两个例子(顶行)对应于类似人的雕塑和非现实主义风格绘画。在这两种情况下,生成器都能保持原始图像的艺术效果,并且忽略诸如眼镜遮挡之类的伪像。

第三行的示例显示了模型对于面部非均匀纹理的稳健性。可以看到,把微笑转换成不满后,女郎鼻翼两侧出现了下陷的法令纹,但模型并没有试图通过添加/去除头发来使纹理均匀化。

底部是一些失败案例。研究人员归纳了失败原因,认为这些很可能都是因为训练数据不足引起的。如红脸男子图所示,当模型输入极端表情时,RGB掩模没有及时调整权重,导致嘴部出现透明化。此外,如果输入图像的主体不是人类,那模型的表现也会很差。

小结

传统的方法,比如Face2Face,需要极度依赖3D面部重建模型,适用面非常小,也难以扩展到任意身份。相反地,这篇论文以解剖学意义上的肌肉运动为条件,在处理极端输入时更稳健,效果更好。总而言之,这是篇不错的论文,而且提出了全然不同的转换方法,它的思路值得学习借鉴。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1922

    浏览量

    73106
  • 生成器
    +关注

    关注

    7

    文章

    314

    浏览量

    20985

原文标题:GANimation:基于解剖结构的面部表情转换(附GitHub地址)

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用全息技术在硅晶圆内部制造纳米结构的新方法

    本文介绍了一种利用全息技术在硅晶圆内部制造纳米结构的新方法。 研究人员提出了一种在硅晶圆内部制造纳米结构的新方法。传统上,晶圆上的微结构加工
    的头像 发表于 11-18 11:45 247次阅读

    上海光机所提出强激光产生高能量子涡旋态电子新方法

    近期,中国科学院上海光学精密机械研究所强场激光物理国家重点实验室研究团队发展了包括轨道角动量量子数的QED散射理论,并提出强激光产生高能量子涡旋态电子的新方法。相关成果以“Generation
    的头像 发表于 10-23 10:41 124次阅读
    上海光机所<b class='flag-5'>提出</b>强激光产生高能量子涡旋态电子<b class='flag-5'>新方法</b>

    保护4-20 mA,±20-mA模拟输入的新方法

    电子发烧友网站提供《保护4-20 mA,±20-mA模拟输入的新方法.pdf》资料免费下载
    发表于 09-24 09:27 0次下载
    保护4-20 mA,±20-mA模拟输入的<b class='flag-5'>新方法</b>

    实践JLink 7.62手动增加新MCU型号支持新方法

    大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是实践JLink 7.62手动增加新MCU型号支持新方法
    的头像 发表于 08-08 15:25 610次阅读
    实践JLink 7.62手动增加新MCU型号支持<b class='flag-5'>新方法</b>

    一种无透镜成像的新方法

    使用OAM-HHG EUV光束对高度周期性结构进行成像的EUV聚光显微镜 为了研究微电子或光子元件中的纳米级图案,一种基于无透镜成像的新方法可以实现近乎完美的高分辨率显微镜。 层析成像是一种强大的无
    的头像 发表于 07-19 06:20 338次阅读
    <b class='flag-5'>一种</b>无透镜成像的<b class='flag-5'>新方法</b>

    一种利用光电容积描记(PPG)信号和深度学习模型对高血压分类的新方法

    高血压,因为这种情况的初期症状并不明显。高血压阶段的分类也很有用,这样个人就可以根据他所处的阶段进行以下生活方式的改变。 光电体积描记法(PPG)是一种检测血液循环变化的光学方法。它
    发表于 05-11 20:01

    使隐形可见:新方法可在室温下探测中红外光

    MIR振动辅助发光(MIRVAL) 来自伯明翰大学和剑桥大学的科学家们开发了一种新方法,利用量子系统在室温下探测中红外线(MIR)光。 这项研究成果发表在《自然·光子学》杂志上,在剑桥大学卡文迪什
    的头像 发表于 04-19 06:31 292次阅读
    使隐形可见:<b class='flag-5'>新方法</b>可在室温下探测中红外光

    轧机牌坊滑板压亏修复的新方法

    电子发烧友网站提供《轧机牌坊滑板压亏修复的新方法.docx》资料免费下载
    发表于 03-14 16:16 0次下载

    氢压机轴承位磨损维修的新方法

    电子发烧友网站提供《氢压机轴承位磨损维修的新方法.docx》资料免费下载
    发表于 03-01 16:23 0次下载

    介绍一种使用2D材料进行3D集成的新方法

    美国宾夕法尼亚州立大学的研究人员展示了一种使用2D材料进行3D集成的新颖方法
    的头像 发表于 01-13 11:37 1039次阅读

    工程结构振弦采集仪的新技术与新方法研究

    工程结构振弦采集仪的新技术与新方法研究 工程结构振弦采集仪的新技术与新方法研究旨在提高采集仪在工程结构振动监测中的性能和可靠性。以下是些可能的研究方向: 1.传感器技术改进:研究新型传感器技术,如
    的头像 发表于 12-20 13:36 318次阅读
    工程结构振弦采集仪的新技术与<b class='flag-5'>新方法</b>研究

    imec提出以亚微米像素尺寸分离颜色的新方法赋能CMOS图像传感器

    据麦姆斯咨询报道,近期,在美国加利福尼亚州旧金山举行的国际电子器件会议(IEEE IEDM 2023)上,比利时纳米电子学和数字技术研究与创新中心imec展示了一种“在300mm晶圆上使用标准后端制造工艺来实现以亚微米像素尺寸分离颜色”新方法
    的头像 发表于 12-19 16:13 665次阅读
    imec<b class='flag-5'>提出</b>以亚微米像素尺寸分离颜色的<b class='flag-5'>新方法</b>赋能CMOS图像传感器

    一种产生激光脉冲新方法

    等离子体中脉冲压缩的概念 英国和韩国的科学家提出了一种产生激光脉冲的新方法,其功率是现有激光脉冲的1000多倍。 科学家们使用计算机模拟联合研究,展示了一种压缩光的
    的头像 发表于 12-07 06:32 474次阅读
    <b class='flag-5'>一种</b>产生激光脉冲<b class='flag-5'>新方法</b>

    IC封装中快速创建结构的新方法

    IC封装中快速创建结构的新方法
    的头像 发表于 12-06 16:34 569次阅读
    IC封装中快速创建结构的<b class='flag-5'>新方法</b>

    应对传统摩尔定律微缩挑战需要芯片布线和集成的新方法

    应对传统摩尔定律微缩挑战需要芯片布线和集成的新方法
    的头像 发表于 12-05 15:32 545次阅读
    应对传统摩尔定律微缩挑战需要芯片布线和集成的<b class='flag-5'>新方法</b>