0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

4DGen:基于动态3D高斯的可控4D生成新工作

CVer 来源:CVer 2024-01-04 15:57 次阅读

一、研究背景

尽管3D和视频生成取得了飞速的发展,由于缺少高质量的4D数据集,4D生成始终面临着巨大的挑战。过去几篇工作尝试了Text-To-4D的任务,但依然存在两个主要问题:

1.由于输入依赖于单视角的图片或者简单的文本描述,并不能保证得到精准的4D结果,需要花费大量的时间进行反复调整。

2.尽管采用了Hexplane作为4D的表征,基于NeRF的方法在高分辨率和长视频上的渲染所需要的计算时间和显存占用是难以接受的。即使采用了一个超分辨的后处理网络,依然会有模糊和闪烁的结果。

为了解决上述问题,4DGen定义了“Grounded 4D Generation“新型任务形式,并且设计了新的算法框架实现高质量的4D内容生成。

二、任务定义

过往的4D生成工作是“one click“的方式,并不能对生成的结果进行有效的控制。4DGen提出了“Grounded 4D Generation“的形式,通过利用视频序列和可选的3D模型作为4D生成的控制信息,可以实现更为精准的4D内容生成。用户可通过输入视频序列或3D模型来约束4D结果的运动和外观;当用户仅提供单张图片作为输入时,可借助预训练好的视频生成模型来得到视频序列;当用户未提供3D模型时,可通过单张图片重建3D模型来作为起始点。

4b408368-a72d-11ee-8b88-92fbcf53809c.png

三、方法介绍

4DGen框架的输入起始点为用户给定或者模型生成的视频序列,对于任意的单张图片,借助多视角生成模型(multi-view diffusion model),可以得到不同视角的图片。4DGen通过对第一帧多视图进行三维重建,得到初始的静态3D Gaussians作为4D生成的起始点。

由于4D数据的匮乏,需要尽可能的从先验模型中蒸馏信息。4DGen将每一帧生成的多视图作为2D伪标签,并且采用多视图生成的点云作为3D点的伪标签来监督训练过程。

因为多视图生成具有ill-posed的特点,得到的伪标签在不同视角之间,不同时序之间存在不连续性,需要引入时间和空间上的一致性损失函数进行约束。相较于拟合多视图DDIM采样得到的图片,score distillation sampling(SDS)是根据先验的扩散模型对场景表达进行似然估计。

4DGen依据正面视角计算任意视角图片在Zero123模型上的SDS损失,用于提升空间上的连续性。为了缓解闪烁问题,4DGen引入了无监督的时间平滑约束。通过计算平面的平滑损失和Gaussians不同时刻的平滑损失,有效提升了时间上的一致性。

4b490ca4-a72d-11ee-8b88-92fbcf53809c.png

四、实施细节

4DGen的 4D表达采用了4D Gaussian Spaltting的方式,通过一个多分辨率Hexplane对每个Gaussian进行编码。将6个时空平面的特征进行相加,并经过一个额外的MLP解码得到对应Gaussian在不同时刻的位置偏移量。

训练上采用三阶段方式,第一阶段对场景进行静态建模,第二阶段利用2D和3D的伪标签进行动态场景的初步建模,第三建模利用平滑损失增强模型的细节和连续性。

所有实验可以在一张RTX3090上完成,对于2.5万个Gaussians只需45分钟的训练,对于9万个Gaussians训练2小时可以得到更加好的细节效果。

五、实验结果

4DGen可以实现不同视角、不同时间的高质量图片渲染。相较于对比方法在细节表达、噪声去除、颜色还原、时空连续性等方面有显著提升。更多视觉效果可以参考项目主页。

4b62246e-a72d-11ee-8b88-92fbcf53809c.png

量化对比上,4DGen采用了不同时序图片和参考图片的CLIP距离来衡量生成质量,采用CLIP-T衡量不同时间下的图像连续性。4DGen在多项指标上明显优于过往方法。

4b7e341a-a72d-11ee-8b88-92fbcf53809c.png

六、总结

4DGen定义了” Grounded 4D Generation“的任务形式,通过视频序列和可选3D模型的引入提升了4D生成的可控性。通过高效的4D Gaussian Splatting的表达,2D和3D伪标签的监督和时空的连续性约束,使得4DGen可以实现高分辨率、长时序的高质量的4D内容生成。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编解码
    +关注

    关注

    1

    文章

    140

    浏览量

    19604
  • SDS
    SDS
    +关注

    关注

    0

    文章

    48

    浏览量

    15715
  • 3D模型
    +关注

    关注

    1

    文章

    72

    浏览量

    15689
  • MLP
    MLP
    +关注

    关注

    0

    文章

    57

    浏览量

    4232

原文标题:3DGS杀疯了!4DGen:基于动态3D高斯的可控4D生成新工作

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    3D打印尚未成熟 4D打印异军突起

    所谓4D打印技术,就是在传统3D打印的概念中加入了“时间”元素,被打印物体可以随着时间的推移而在形态上发生自我调整。
    发表于 05-10 14:32 1258次阅读

    生成显示4D数据——LabVIEW中3D Mesh的研究,附赠256色色谱生成

    各种设置,再也不用在程序框图编写烦人的属性节点了。而且还有右键另存为的功能导出图片!!见3D Scatter.vi控件:框图:4 附赠256色色谱生成器(\Color Spectrum\Color
    发表于 07-11 13:34

    3D NAND与4D NAND之间的差别在哪儿?

    什么是3D NAND?什么是4D NAND?3D NAND与4D NAND之间的差别在哪儿?
    发表于 06-18 06:06

    神奇的4D打印:物体可完成自我组装

    你听说过4D打印吗?相比3D,这种更高级的打印技术,除了包括三维立体结构,还增加了时间线。4D打印只需直接将想要的性状输入到材料中,物体就会经过“形变”自动组装,而不需要任何设备。
    发表于 05-06 10:14 1369次阅读

    4d打印技术是什么?

    就是通过3D打印机,将电脑设计完成的数字模型文件通过粉末状金属或者塑料进行打印,构造出我们想要的物体。如今,4D打印的概念又被推出,那么究竟4d打印技术是什么呢?
    发表于 10-26 11:40 8039次阅读

    4d打印与3d打印有什么区别?

    尽管3D打印技术兴起的时间不长,大多数人还没来得及弄清它是怎么回事,一项更先进的4D打印技术又崭露头角、不期而至,大有彻底改变传统工业打印甚至建筑行业之势。
    发表于 10-26 14:08 2.9w次阅读

    4d打印技术的应用

    4D打印的创新点在于“变”,它是一个动态的过程,它不但能够创造出有智慧、有适应能力的新事物,而且可以彻底改变传统的工业打印。4D打印技术是对3D技术的改进和完善,
    发表于 10-26 14:32 8454次阅读

    4D打印技术是什么,与3D打印有何区别?

    3D打印相比,4D打印在3D打印的基础上增加了一个时间维度,即4D打印的物件会随着时间的推移(自动)变成不同的形状。
    发表于 10-15 10:45 9139次阅读

    4d打印原理

    所谓的4D打印,比3D打印多了一个“D”也就是时间维度,人们可以通过软件设定模型和时间,变形材料会在设定的时间内变形为所需的形状。准确地说4D打印是一种能够自动变形的材料,直接将设计内
    的头像 发表于 04-04 15:33 4722次阅读

    4d打印比3d多了什么

    4D打印,准确地说是一种能够自动变形的材料,只需将其放入水中,不需要连接任何复杂的机电设备,就能按照产品设计自动折叠成相应的形状。4D打印最关键是记忆合金。
    的头像 发表于 04-08 14:49 6976次阅读

    4D打印与3D打印区别在哪?

    尽管早在2013年美国麻省理工学院就已经展示出了一个关于4D打印技术的实验,但该技术当时并未引起太大关注。一直到2014年10月8日,美国《外交》双月刊发表了一篇名为《准备迎接4D打印革命
    发表于 07-27 11:14 5722次阅读

    4D打印来了!

    来源:SAMPECHINA,微注塑,腾讯视频,通用机械 也许,你连3D打印具体是什么都还未完全搞清楚,现在4D又来了 4D打印,准确地说是一种能够自动变形的材料,只需将其放入水中,不需要连接任何复杂
    的头像 发表于 09-04 09:26 2605次阅读

    什么是4D毫米波雷达?4D毫米波雷达与传统雷达有何区别?

    在2023年的CES上,4D成像毫米波雷达(简称4D毫米波雷达、4D成像雷达或4D雷达)备受瞩目。
    的头像 发表于 03-13 09:58 1.4w次阅读

    Meta提出Make-A-Video3D:一行文本,生成3D动态场景!

    具体而言,该方法运用 4D 动态神经辐射场(NeRF),通过查询基于文本到视频(T2V)扩散的模型,优化场景外观、密度和运动的一致性。任意机位或角度都可以观看到提供的文本生成动态视频
    的头像 发表于 03-24 10:47 1008次阅读

    4D毫米波雷达的拆解报告分享

    如果把测速测距雷达称之为2D雷达,测速测距测角雷达就是3D雷达,如果再加一个测量高度,那就是4D雷达。
    发表于 04-29 09:24 895次阅读
    <b class='flag-5'>4D</b>毫米波雷达的拆解报告分享