0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SHERF:可泛化可驱动人体神经辐射场的新方法

CVer 来源:CVer 2023-08-15 11:46 次阅读

人体神经辐射场的目标是从 2D 人体图片中恢复高质量的 3D 数字人并加以驱动,从而避免耗费大量人力物力去直接获取 3D 人体几何信息。这个方向的探索对于一系列应用场景,比如虚拟现实和辅助现实场景,有着非常大潜在性的影响。

现有人体神经辐射场生成和驱动技术主要可以分为两类。

第一类技术利用单目或者多目人体视频去重建和驱动 3D 数字人。这类技术主要是针对特定数字人的建模和驱动,优化耗时大,缺乏泛化到大规模数字人重建上的能力。

第二类技术为了提升 3D 数字人重建的效率。提出利用多视角人体图片作为输入去重建人体神经辐射场。

尽管这第二类方法在 3D 人体重建上取得了一定的效果,这类方法往往需要特定相机角度下的多目人体图片作为输入。在现实生活中,我们往往只能获取到任意相机角度下人体的一张图片,给这类技术的应用提出了挑战。

ICCV2023 上,南洋理工大学 - 商汤科技联合研究中心 S-Lab 团队提出了基于单张图片的可泛化可驱动人体神经辐射场方法 SHERF

SHERF 可以基于用户输入的一张任意相机角度 3D 人体图片,该角度下相机和人体动作体型(SMPL)参数,以及给定目标输出空间下任意相机参数和人体动作体型(SMPL)参数,重建并驱动该 3D 数字人。本方法旨在利用任意相机角度下人体的一张图片去重建和驱动 3D 人体神经辐射场。

cb20cf1a-3b1d-11ee-9e74-dac502259ad0.png

图 1

基本原理

人体神经辐射场重建和驱动主要分为五个步骤(如图 2 所示)。

cb807654-3b1d-11ee-9e74-dac502259ad0.png

图 2

第一步为目标空间(target space)到标准空间(canonical space)的坐标转换基于用户输入目标输出空间下任意人体动作体型参数和相机外参参数,在目标空间内射出光线,并在光线上采样一系列空间点,利用 SMPL 算法的逆线性蒙皮转换(Inverse Linear Blend Skinning)将目标空间里的空间点转换到标准空间中。

第二步为提取标准空间中 3D 点对应的层级特征(hierarchical feature)。

全局特征(global feature)提取:利用二维编码网络(2D Encoder)从输入图片提取一维特征,并利用映射网络(Mapping Network)和风格编码网络(Style-Based Encoder)进一步将 1D 特征转换为标准空间下的三平面特征(Tri-plane),接下来将标准空间中 3D 点投影到三平面提取相应的全局特征;

点级别特征(Point-Level Feature)提取:首先利用二维编码网络(2D Encoder)从输入图片提取二维特征,并将观测空间(observation space)下 SMPL 的顶点投影到输入图片成像平面上去提取相应特征,紧接着利用 SMPL 算法的逆线性蒙皮转换(Inverse Linear Blend Skinning)将观测空间下 SMPL 的顶点转到标准空间下构建稀疏三维张量,然后利用稀疏卷积得到标准空间中 3D 点的点级别特征;

像素级别特征(Pixel-Aligned Feature)提取:首先利用二维编码网络(2D Encoder)从输入图片提取二维特征,并利用 SMPL 算法的线性蒙皮转换(Linear Blend Skinning)将标准空间中 3D 点转到观测空间下,再投影到输入图片成像平面上去提取相应像素级别特征。

第三步为特征融合(Feature Fusion Transformer),利用 Transformer 模型将三种不同级别的特征进行融合。第四步为人体神经辐射场解码生成相应图片信息,将标准空间中 3D 点坐标,光线方向向量和对应特征输入到人体神经辐射场解码网络中得到 3D 点的体密度和颜色信息,并进一步基于体渲染(Volume Rendering)在目标空间下生成相应像素的颜色值,并得到最终用户输入目标输出空间下任意人体动作体型参数和相机外参参数下的图片。

基于以上步骤,给定目标输出空间下任意人体动作序列(SMPL)参数可以从 2D 图片恢复 3D 数字人并加以驱动。

结果比较

本文在四个人体数据集上人体数据集上进行了实验,分别是 THuman,RenderPeople,ZJU_MoCap,HuMMan。

该研究对比了对比了最先进的可泛化多视角人体图片的人体神经辐射场方法,NHP 和 MPS-NeRF。本文在 peak signal-to-noise ratio (PSNR),structural similarity index (SSIM),以及 Learned Perceptual Image Patch Similarity (LPIPS)进行了比较。如下图所示,本文在所有数据集,所有指标上均大幅超越之前的方案。

cbd5035e-3b1d-11ee-9e74-dac502259ad0.png

SHERF 动态驱动 3D 人体结果如下图所示:

cbed58aa-3b1d-11ee-9e74-dac502259ad0.gifcbf9108c-3b1d-11ee-9e74-dac502259ad0.gifcc0a1490-3b1d-11ee-9e74-dac502259ad0.gif

cec3dc34-3b1d-11ee-9e74-dac502259ad0.gifced5582e-3b1d-11ee-9e74-dac502259ad0.gifcf39d4d4-3b1d-11ee-9e74-dac502259ad0.gif

cf8f8e24-3b1d-11ee-9e74-dac502259ad0.gifcf9d71a6-3b1d-11ee-9e74-dac502259ad0.gifcfb0d688-3b1d-11ee-9e74-dac502259ad0.gif

从左到右分别为input Image、motion seq 1、motion seq 2

本文同样验证了在 in-the-wild DeepFashion 数据上的泛化和驱动效果,如下图 3 所示,给定任意一张输入图片,本文利用单视角估 SMPL 的先进算法估出 SMPL 和相应相机角度,后利用本文提出的算法对 3D 人体进行驱动。实验结果显示 SHERF 具有较强的泛化性。

d02506a2-3b1d-11ee-9e74-dac502259ad0.png

d08b68d4-3b1d-11ee-9e74-dac502259ad0.gifd0b45a14-3b1d-11ee-9e74-dac502259ad0.gif

从左到右分别为input Image、motion seq 1、motion seq 2

应用前景

在游戏电影制作,虚拟现实增强现实或者其他需要数字人建模的场景,用户可以无需专业技能,专业软件,即可通过输入的一张任意相机角度 3D 人体图片,该角度下相机的参数和相应的人体动作体形参数(SMPL),就可以达到重建并驱动该 3D 数字人的目的。

结语

本文提出一种基于单张输入图片可泛化可驱动的人体神经辐射场方法 SHERF。可以承认的是,本文依然存在一定的缺陷。

首先,对于输入图片观测不到一部分人体表面, 渲染出来的结果可以观察到一定的瑕疵,一个解决的办法是建立一种遮挡可知(occlusion-aware)的人体表征。

其次,关于如何补齐输入图片观测不到人体部分依旧是一个很难得问题。本文从重建角度提出 SHERF,只能对观测不到的人体部分给出一个确定性的补齐,对观测不到部分的重建缺乏多样性。一个可行的方案是利用生成模型在观测不到的人体部分生成多样性高质量的 3D 人体效果。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    53

    文章

    8302

    浏览量

    147232
  • 编码器
    +关注

    关注

    45

    文章

    3679

    浏览量

    135399

原文标题:ICCV 2023 | SHERF:可泛化可驱动人体神经辐射场的新方法

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    判断膨胀石墨好坏的方法

    在现代工业中,膨胀石墨作为一种高性能材料,广泛应用于石油化工、纺织、冶金、电力、机械、船舶、消防、航天及核能等领域。其优良的可塑性、柔韧延展性和密封性,以及耐高温、耐高压、耐腐蚀、耐辐射等特性
    的头像 发表于 01-09 15:09 152次阅读

    大华股份荣获中国创新方法大赛一等奖

    近日,备受瞩目的2024年中国创新方法大赛全国总决赛在重庆圆满落下帷幕。此次大赛由中国科协与重庆市人民政府联合主办,吸引了众多创新企业和团队参与,共同展示创新成果,角逐荣誉奖项。 在这场创新盛宴中
    的头像 发表于 12-27 14:50 260次阅读

    基于遗传算法的QD-SOA设计新方法

    了QD-SOA的设计,提出了一种基于遗传算法的QD-SOA设计新方法。由于具有用于设计的模型是必不可少的,因此在第一步中获得数值模型。然后,利用从数值模型中采样的训练数据建立人工神经网络模型。实验表明,该神经模型具有较高的精度和
    的头像 发表于 12-17 09:58 173次阅读
    基于遗传算法的QD-SOA设计<b class='flag-5'>新方法</b>

    一种降低VIO/VSLAM系统漂移的新方法

    本文提出了一种新方法,通过使用点到平面匹配将VIO/VSLAM系统生成的稀疏3D点云与数字孪生体进行对齐,从而实现精确且全球一致的定位,无需视觉数据关联。所提方法为VIO/VSLAM系统提供了紧密
    的头像 发表于 12-13 11:18 275次阅读
    一种降低VIO/VSLAM系统漂移的<b class='flag-5'>新方法</b>

    大华股份荣获2024年中国创新方法大赛一等奖

    近日,由中国科协、重庆市人民政府举办的2024年中国创新方法大赛全国总决赛在重庆落下帷幕。大华股份灵活运用创新方法、突破行业性技术难题,凭借“不惧强光,分毫必现,基于TRIZ的强逆光锐捕技术”项目,斩获全国一等奖。
    的头像 发表于 12-04 17:19 413次阅读

    利用全息技术在硅晶圆内部制造纳米结构的新方法

    本文介绍了一种利用全息技术在硅晶圆内部制造纳米结构的新方法。 研究人员提出了一种在硅晶圆内部制造纳米结构的新方法。传统上,晶圆上的微结构加工,仅限于通过光刻技术在晶圆表面加工纳米结构。 然而,除了晶
    的头像 发表于 11-18 11:45 421次阅读

    保护4-20 mA,±20-mA模拟输入的新方法

    电子发烧友网站提供《保护4-20 mA,±20-mA模拟输入的新方法.pdf》资料免费下载
    发表于 09-24 09:27 0次下载
    保护4-20 mA,±20-mA模拟输入的<b class='flag-5'>新方法</b>

    比较分析两种不同的提高栅极驱动电流的方法

    电子发烧友网站提供《比较分析两种不同的提高栅极驱动电流的方法.pdf》资料免费下载
    发表于 09-23 11:13 0次下载
    比较分析两种不同的<b class='flag-5'>可</b>提高栅极<b class='flag-5'>驱动</b>电流的<b class='flag-5'>方法</b>

    实践JLink 7.62手动增加新MCU型号支持新方法

    大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是实践JLink 7.62手动增加新MCU型号支持新方法
    的头像 发表于 08-08 15:25 859次阅读
    实践JLink 7.62手动增加新MCU型号支持<b class='flag-5'>新方法</b>

    一种无透镜成像的新方法

    使用OAM-HHG EUV光束对高度周期性结构进行成像的EUV聚光显微镜 为了研究微电子或光子元件中的纳米级图案,一种基于无透镜成像的新方法可以实现近乎完美的高分辨率显微镜。 层析成像是一种强大的无
    的头像 发表于 07-19 06:20 456次阅读
    一种无透镜成像的<b class='flag-5'>新方法</b>

    使隐形可见:新方法可在室温下探测中红外光

    MIR振动辅助发光(MIRVAL) 来自伯明翰大学和剑桥大学的科学家们开发了一种新方法,利用量子系统在室温下探测中红外线(MIR)光。 这项研究成果发表在《自然·光子学》杂志上,在剑桥大学卡文迪什
    的头像 发表于 04-19 06:31 379次阅读
    使隐形可见:<b class='flag-5'>新方法</b>可在室温下探测中红外光

    轧机牌坊滑板压亏修复的新方法

    电子发烧友网站提供《轧机牌坊滑板压亏修复的新方法.docx》资料免费下载
    发表于 03-14 16:16 0次下载

    摄入电子设备可用于追踪和治疗人体胃肠道中的不同疾病

    5000万的销售额,该手表可以测量体温和心率,检查人体血氧水平,并展示心电图。这可能只是生物电子设备在持续健康监测和个性医疗方面的一个开端。 首先,生物电子设备的形式多样,从可穿戴到植入再到
    的头像 发表于 03-09 16:08 4273次阅读

    氢压机轴承位磨损维修的新方法

    电子发烧友网站提供《氢压机轴承位磨损维修的新方法.docx》资料免费下载
    发表于 03-01 16:23 0次下载

    8米-75米桁架式液压倒伏升降塔 三角/四角伸缩塔 移动式升降雷达塔

    伸缩
    jf_43484788
    发布于 :2024年02月28日 10:55:51