0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

逼真到头发丝,光线可调,Meta推出实时3D头像合成方法

3D视觉工坊 来源:机器之心 2023-12-10 10:02 次阅读

Meta 一直没放弃元宇宙。

2021 年,Facebook 将「元宇宙(metaverse)」作为公司主营业务,并将公司名称更改为 Meta。然而,这一年,随着 ChatGPT 的横空出世,生成式 AI 成为一个新的研究趋势,很多科技公司都将生成式 AI 作为公司重要研发业务。但 Meta 一直没有停止 VR/AR 的研究步伐。

最近,Meta 的 Codec Avatars Lab 提出了一种高保真、光线可调节的虚拟头像合成方法 ——Relightable Gaussian Codec Avatars。

302b95da-96ad-11ee-8b88-92fbcf53809c.png

论文地址:https://arxiv.org/pdf/2312.03704.pdf

项目主页:https://shunsukesaito.github.io/rgca/

今年 9 月,Meta 首席执行官马克・扎克伯格与麻省理工学院(MIT)科学家 Lex Fridman 在元宇宙里进行了一小时的对话。彼时,两位的形象是使用扫描技术构建的用户面部 3D 模型,逼真度已经很高。

现在,Relightable Gaussian Codec Avatars 能够构建更加逼真、光线可调节的实时 3D 头像,精细到连头发丝都清晰可见:

30442b4a-96ad-11ee-8b88-92fbcf53809c.png

下面我们来看下 Relightable Gaussian Codec Avatars 方法的核心内容和实验结果。

方法简介

我们知道,人类的视觉感知对人脸外观高度敏感,因此合成 3D 头像 / 虚拟化身(avatar)一直存在一些挑战。

首先,人类头部由高度复杂和多样化的材料组成,这些材料表现出不同的散射和反射特性。例如,皮肤由于微观几何形状以及显著的次表面散射而产生复杂的反射,头发由于其半透明纤维结构而表现出具有多次反射的面外散射,而眼睛有多个具有高反射膜的层。总的来说,没有一种单一的材料表征可以准确地表示所有这些,尤其是实时的。

为了以统一的方式表征人体头部的多种材质,该研究提出了一种基于可学习辐射传输(radiance transfer)的新型可重新照明外观模型,使用球面高斯实现了全频率反射的实时重新照明。

304d9a86-96ad-11ee-8b88-92fbcf53809c.gif

另一方面,对运动中的底层几何体进行精确跟踪和建模极具挑战性。为此,该研究提出基于 3D 高斯的可驱动化身,使用 Gaussian Splatting 技术有效地渲染复杂的几何细节。

305a52ee-96ad-11ee-8b88-92fbcf53809c.gif

3063e49e-96ad-11ee-8b88-92fbcf53809c.gif

此外,该研究还提出了可重新照明的显式眼睛模型,首次以完全数据驱动的方式实现对其他面部运动以及全频率眼部反射的注视控制,并进一步提高了眼睛反射的保真度。

30714d00-96ad-11ee-8b88-92fbcf53809c.gif

最终,Relightable Gaussian Codec Avatars 可以捕获 3D 一致的亚毫米细节,例如动态面部序列上的发丝和毛孔。

307d7a30-96ad-11ee-8b88-92fbcf53809c.png

实验及结果

上图 1 显示了重建的虚拟人物可以拥有新的表情、视图以及光照,包括点光源和高分辨率环境图。就连眼睛中的光反射,都忠实地再现了周围环境,而不会丢失高频细节。

如图 3 所示,Relightable Gaussian Codec Avatars方法能够实现 3D 一致且高保真的内部分解。

30846a0c-96ad-11ee-8b88-92fbcf53809c.png

几何表征。该研究通过比较三种变体来评估几何组件:本文方法、本文方法但排除了显式眼睛模型(EEM)和基于体素的原型。为了公平比较,该研究使用相同的外观模型,仅改变几何表征(表 1 和表 2 B、D、H)。

3090d09e-96ad-11ee-8b88-92fbcf53809c.png

309a584e-96ad-11ee-8b88-92fbcf53809c.png

图 4 清楚地表明,基于 3D 高斯的几何体可以比 MVP 更好地建模皮肤细节和发丝。此外,完整的模型与 EEM 结合使用时,眼睛里的反光都非常令人折服。除了在强光下的 SSIM 指标外,高斯模型在所有指标中都取得了优异的性能。

30a5828c-96ad-11ee-8b88-92fbcf53809c.png

外观表征。对于外观表征,该研究将外观模型与现有的 relightable 外观表征进行了比较。如上表 1 和表 2 C、D、E 显示,本文的外观表征在大多数指标中优于现有的外观模型。

如图 5 所示,虽然线性模型可以产生正确的颜色,但 relighting 的结果模糊且缺乏高频细节。EyeNeRF 中与视图相关的球谐函数显示出更详细的反射,但由于使用球谐函数来实现镜面反射,因此其表现力受到限制。此外,该研究观察到依赖于视图的球谐函数更容易过度拟合,从而导致动画中出现闪烁伪影。相比之下,Relightable Gaussian Codec Avatars方法不受带宽限制,因此实现了高频反射。

30b1c7b8-96ad-11ee-8b88-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2862

    浏览量

    107321
  • Facebook
    +关注

    关注

    3

    文章

    1429

    浏览量

    54643
  • Meta
    +关注

    关注

    0

    文章

    259

    浏览量

    11344

原文标题:逼真到头发丝,光线可调,Meta推出实时3D头像合成方法

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    裸眼3D笔记本电脑——先进的光场裸眼3D技术

    随着科技的不断进步,裸眼3D技术已经不再是科幻电影中的幻想。如今,英伦科技裸眼3D笔记本电脑将这一前沿科技带到了我们的日常生活中。无论你是专业的3D模型设计师,还是希望在视频播放和模型展示中体验
    的头像 发表于 07-16 10:04 458次阅读

    Meta推出革命性3D Gen AI模型:1分钟内生成高质量3D内容

    在科技日新月异的今天,Meta再次引领创新潮流,宣布了一项令人瞩目的技术突破——3D Gen AI模型的诞生。这款先进的模型以其前所未有的高效性与卓越品质,重新定义了3D内容创作的边界,标志着数字艺术创作进入了一个全新的快速响应
    的头像 发表于 07-04 18:12 988次阅读

    奥比中光3D相机打造高质量、低成本的3D动作捕捉与3D动画内容生成方

    高质量、低成本的3D动作捕捉与3D动画内容生成方案。 Moverse公司总部位于希腊塞萨洛尼基,是三维动画相关媒体和娱乐行业的一家科技创业公司。基于奥比中光3D相机,Moverse可以
    的头像 发表于 06-25 16:37 1023次阅读

    VIVERSE 推行实时3D渲染: 探索Polygon Streaming技术力量与应用

    在商业领域和娱乐行业中,3D渲染技术一直是推动视觉体验革新的关键力量。随着技术的进步,实时3D渲染技术逐渐成为主流,近期VIVERSE平台对外发布引入一项全新技术——Polygon
    的头像 发表于 05-31 15:49 2298次阅读
    VIVERSE 推行<b class='flag-5'>实时</b><b class='flag-5'>3D</b>渲染: 探索Polygon Streaming技术力量与应用

    光纤尖端上3D打印的玻璃折射率传感器,可测量有机溶剂的浓度

    据麦姆斯咨询报道,瑞典斯德哥尔摩皇家理工学院(KTH Royal Institute of Technology)的研究人员首次在光纤尖端(其表面小至只有人类头发丝横截面大小)上3D打印了石英玻璃微光学器件。
    的头像 发表于 05-24 09:39 424次阅读
    光纤尖端上<b class='flag-5'>3D</b>打印的玻璃折射率传感器,可测量有机溶剂的浓度

    天马微电子首发TIANMA META SIGHT光场3D解决方案

    3D显示领域,视角的大小和画面的稳定性一直是行业内的难题,TIANMA META SIGHT 3D光场显示器采用了先进的追踪式超多视点技术
    的头像 发表于 05-23 10:21 457次阅读
    天马微电子首发TIANMA <b class='flag-5'>META</b> SIGHT光场<b class='flag-5'>3D</b>解决方案

    UltiMaker正式推出了工业级3D打印机—UltiMaker Factor 4

    与之前的UltiMaker S系列桌面3D打印机不同,全球3D打印领域的领导者UltiMaker正式推出了工业级3D打印机——UltiMaker Factor 4。
    的头像 发表于 05-09 16:58 478次阅读

    Meta发布SceneScript视觉模型,高效构建室内3D模型

    Meta 表示,此模型具备创建室内 3D 模型的高效与轻便,仅需几KB内存便能生成完整清晰的几何图形,同时,这些形状数据具备可解释性,便于用户理解和编辑。
    的头像 发表于 03-26 11:16 548次阅读

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该模型以其独特的功能吸引了众多关注。此模型具备从单张图像中生成多视图3D视频的能力,为视频制作领域带来了革命性的突破。
    的头像 发表于 03-22 10:30 784次阅读

    谷歌模型合成软件有哪些

    谷歌模型合成软件通常指的是谷歌提供的用于创建、修改和共享3D模型的软件。目前,谷歌推出的模型合成软件中最知名的是Google SketchUp。
    的头像 发表于 02-29 18:20 1339次阅读

    Adobe提出DMV3D3D生成只需30秒!让文本、图像都动起来的新方法

    因此,本文研究者的目标是实现快速、逼真和通用的 3D 生成。为此,他们提出了 DMV3D。DMV3D 是一种全新的单阶段的全类别扩散模型,能直接根据模型文字或单张图片的输入,生成
    的头像 发表于 01-30 16:20 806次阅读
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!让文本、图像都动起来的新<b class='flag-5'>方法</b>!

    友思特C系列3D相机:实时3D点云图像

    3D相机
    虹科光电
    发布于 :2024年01月10日 17:39:25

    一文了解3D视觉和2D视觉的区别

    一文了解3D视觉和2D视觉的区别 3D视觉和2D视觉是两种不同的视觉模式,其区别主要体现在立体感、深度感和逼真度上。本文将详细阐述这些区别,
    的头像 发表于 12-25 11:15 2875次阅读

    深度解析3D视觉成像几种典型方案

    类似于ToF相机、光场相机这类相机,可以归类为单相机3D成像范围,它们体积小,实时性好,适合Eye-in-Hand系统执行3D测量、定位和实时引导。
    发表于 12-05 12:24 918次阅读
    深度解析<b class='flag-5'>3D</b>视觉成像几种典型方案

    阿迪达斯与 Covision Media 使用 AI 和 NVIDIA RTX 创建逼真3D 内容

    使用的传统方法(比如基于摄影测量法的应用和扫描仪等)可能需要数小时乃至数天的时间,而且这些方法有时无法提供高质量的 3D 质量和细节水平,而在所有应用中呈现逼真的模型。 位于意大利的初
    的头像 发表于 11-28 18:45 626次阅读
    阿迪达斯与 Covision Media 使用 AI 和 NVIDIA RTX 创建<b class='flag-5'>逼真</b>的 <b class='flag-5'>3D</b> 内容