0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

北京大学提出Repaint123:纹理质量、多视角一致性新SOTA!

CVer 来源:量子位(QbitAI) 2024-01-08 16:13 次阅读

只需两分钟,玩转图片转3D!

还是高纹理质量、多视角高一致性的那种。

3d6cab32-ade4-11ee-8b88-92fbcf53809c.gif

不管是什么物种,输入时的单视图图像还是这样婶儿的:

3d830f76-ade4-11ee-8b88-92fbcf53809c.png

两分钟后,3D版大功告成:

3d8d682c-ade4-11ee-8b88-92fbcf53809c.gif

△上,Repaint123(NeRF);下,Repaint123(GS)

新方法名为Repaint123,核心思想是将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力相结合,来生成高质量、多视角一致的图像。

此外,该研究还引入了针对重叠区域的可见性感知自适应再绘强度的方法。

Repaint123一举解决了此前方法多视角偏差大、纹理退化、生成慢等问题。

3da395b6-ade4-11ee-8b88-92fbcf53809c.png

目前项目代码还未在GitHub公布,就有100+人赶来标星码住:

3da9aca8-ade4-11ee-8b88-92fbcf53809c.png

Repaint123长啥样?

之前,将图像转换为3D的方法通常采用Score Distillation Sampling (SDS)。尽管该方法的结果令人印象深刻,但存在一些问题,如多视角不一致、过度饱和、过度平滑的纹理以及生成速度缓慢。

3db18fae-ade4-11ee-8b88-92fbcf53809c.gif

△从上至下:输入,Zero123-XL,Magic123,Dream gaussian

为了解决这些问题,来自北京大学、鹏城实验室、新加坡国立大学、武汉大学的研究人员提出了Repaint123。

3e851694-ade4-11ee-8b88-92fbcf53809c.png

总的来说,Repaint123有这几点贡献:

(1)Repaint123通过综合考虑图像到3D生成的可控重绘过程,能够生成高质量的图片序列,并确保这些图片在多个视角下保持一致。

(2)Repaint123提出了一个简单的单视图3D生成的基准方法。

在粗模阶段,它利用Zero123作为3D先验,并结合SDS损失函数,通过优化Gaussian Splatting几何,快速生成粗糙的3D模型(仅需1分钟)。

在细模阶段,它采用Stable Diffusion作为2D先验,并结合均方误差(MSE)损失函数,通过快速细化网格纹理,生成高质量的3D模型(同样只需1分钟)。

(3)大量的实验证明了Repaint123方法的有效性。它能够在短短2分钟内,从单张图像中生成与2D生成质量相匹配的高质量3D内容。

3e894bd8-ade4-11ee-8b88-92fbcf53809c.png

△实现3D一致且高质量的单视角3D快速生成

下面来看具体方法。

Repaint123专注于优化mesh细化阶段,其主要改进方向涵盖两个方面:生成具有多视角一致性的高质量图像序列以及实现快速而高质量的3D重建。

1、生成具有多视角一致性的高质量图像序列

生成具有多视角一致性的高质量图像序列分为以下三个部分:

3e8e6fa0-ade4-11ee-8b88-92fbcf53809c.png

△多视角一致的图像生成流程

DDIM反演

为了保留在粗模阶段生成的3D一致的低频纹理信息,作者采用了DDIM反演将图像反演到确定的潜在空间,为后续的去噪过程奠定基础,生成忠实一致的图像。

可控去噪

为了在去噪阶段控制几何一致性和长程纹理一致性,作者引入了ControlNet,使用粗模渲染的深度图作为几何先验,同时注入参考图的Attention特征进行纹理迁移。

此外,为了执行无分类器引导以提升图像质量,论文使用CLIP将参考图编码为图像提示,用于指导去噪网络

重绘

渐进式重绘遮挡和重叠部分为了确保图像序列中相邻图像的重叠区域在像素级别对齐,作者采用了渐进式局部重绘的策略。

在保持重叠区域不变的同时,生成和谐一致的相邻区域,并从参考视角逐步延伸到360°。

然而,如下图所示,作者发现重叠区域同样需要进行细化,因为在正视时之前斜视的区域的可视分辨率变大,需要补充更多的高频信息。

另外,细化强度等于1-cosθ*,其中θ*为之前所有相机视角与所视表面法向量夹角θ的最大值,从而自适应地重绘重叠区域。

3e92e94a-ade4-11ee-8b88-92fbcf53809c.png

△相机视角与细化强度的关系

为了选择适当的细化强度,以在提高质量的同时保证忠实度,作者借鉴了投影定理和图像超分的思想,提出了一种简单而直接的可见性感知的重绘策略来细化重叠区域。

2、快速且高质量的3D重建

正如下图所展示的,作者在进行快速且高质量的3D重建过程中,采用了两阶段方法。

3e9e61ee-ade4-11ee-8b88-92fbcf53809c.png

△Repaint123两阶段单视角3D生成框架

首先,他们利用Gaussian Splatting表示来快速生成合理的几何结构和粗糙的纹理。

同时,借助之前生成的多视角一致的高质量图像序列,作者能够使用简单的均方误差(MSE)损失进行快速的3D纹理重建。

一致性、质量和速度最优

研究人员对多个单视图生成任务的方法进行了比较。

3ea2ed04-ade4-11ee-8b88-92fbcf53809c.png

△单视图3D生成可视化比较

在RealFusion15和Test-alpha数据集上,Repaint123取得了在一致性、质量和速度三个方面最领先的效果。

3ea7db98-ade4-11ee-8b88-92fbcf53809c.png

同时,作者也对论文使用的每个模块的有效性以及视角转动增量进行了消融实验:

3eac0592-ade4-11ee-8b88-92fbcf53809c.png

3eb48456-ade4-11ee-8b88-92fbcf53809c.png

并且发现,视角间隔为60度时,性能达到峰值,但视角间隔过大会减少重叠区域,增加多面问题的可能性,所以40度可作为最佳视角间隔。

3eb9b188-ade4-11ee-8b88-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2781

    浏览量

    106687
  • 图像
    +关注

    关注

    2

    文章

    1072

    浏览量

    40131
  • 模型
    +关注

    关注

    1

    文章

    2865

    浏览量

    48070

原文标题:1张图2分钟转3D!北京大学提出Repaint123:纹理质量、多视角一致性新SOTA!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    引领高校原生人才新生态 北京大学鲲鹏昇腾科教创新卓越中心正式成立

    6月22日,北京大学与华为技术有限公司在北京签署合作协议,“北京大学 鲲鹏昇腾科教创新卓越中心”(以下简称“卓越中心”)正式成立揭牌。双方将围绕卓越中心着力推动科研平台建设,基于鲲鹏昇腾技术路线
    的头像 发表于 06-25 16:23 187次阅读
    引领高校原生人才新生态 <b class='flag-5'>北京大学</b>鲲鹏昇腾科教创新卓越中心正式成立

    请问ESP-NOW对数据的完整一致性有校验吗?

    当使用ESP-NOW时,传递的数据在传输层有对数据包的完整(比如对面传给我的字节数和我收到的字节数是否相同)有底层校验吗? 还有这个数据包是否经过了CRC等差错检测的校验呢(就是一致性校验)?
    发表于 06-17 06:55

    使用atom生成pwm时发现尽管我同时启动了多路pwm,但从时序上看pwm的无法保证时间一致性,为什么?

    您好,我在使用atom生成pwm时发现尽管我同时启动了多路pwm,但从时序上看pwm的无法保证时间一致性,由于我有捕捉pwm某时刻输出对应相电压的精确采样的要求,这导致了我采样时间的偏差。如下
    发表于 05-30 06:33

    润石科技董事长参加北京大学集成电路学院“未名·芯”论坛

    2024年5月5日,在纪念五四运动105周年,也是北京大学建校126周年之际,润石科技董事长张明先生受北京大学集成电路学院校友返校、共叙情谊活动邀请
    的头像 发表于 05-11 14:06 416次阅读

    北京大学讲座 | 大模型时代的软件研发:技术、范式与工具

    3 月 10 日,华为云与北京大学合作在软件和微电子学院举办了此次关于研发大模型的讲座,这不仅是华为云与北大第一次在 AI 大模型上进行产教融合,更是双方对于推动大模型研发与应用,培养相关技术人才
    的头像 发表于 05-09 23:00 253次阅读
    <b class='flag-5'>北京大学</b>讲座 | 大模型时代的软件研发:技术、范式与工具

    北京大学-知存科技存算一体联合实验室揭牌,开启知存科技产学研融合战略新升级

    5月5日,“北京大学-知存科技存算一体技术联合实验室”在北京大学微纳电子大厦正式揭牌,北京大学集成电路学院院长蔡一茂、北京大学集成电路学院副院长鲁文高及学院相关负责人、知存科技创始人兼
    的头像 发表于 05-07 19:31 987次阅读
    <b class='flag-5'>北京大学</b>-知存科技存算一体联合实验室揭牌,开启知存科技产学研融合战略新升级

    北京大学问世世界最薄光学晶体:氮化硼晶体

    据悉,光学晶体被誉为激光技术的核心部件,广泛运用于微纳加工、量子光源及生物检测等领域。北京大学科研团队通过不断尝试,最终确定氮化硼作为最适合研发新型激光器的材料。
    的头像 发表于 04-26 10:41 408次阅读

    北京大学高性能计算综合能力竞赛圆满结束

    共22名。第一届北京大学高性能计算综合能力竞赛面向全国高校在校同学,致力于激发同学们的创新意识,培养运用高性能计算技术解决复杂问题的能力,以全新的科技视角去探索前沿
    的头像 发表于 04-14 08:34 312次阅读
    <b class='flag-5'>北京大学</b>高性能计算综合能力竞赛圆满结束

    百川智能与北京大学将共建通用人工智能联合实验室

    近日,百川智能与北京大学携手合作,共同签署了“北大——百川通用人工智能联合实验室”的共建协议,标志着双方在人工智能领域迈出了坚实的合作步伐。
    的头像 发表于 03-21 11:45 544次阅读

    北京大学首次硬件实现电容耦合的VO2相变振荡动力学计算系统

    北京大学集成电路学院杨玉超教授课题组首次硬件实现了电容耦合的VO2相变振荡动力学计算系统。
    的头像 发表于 02-28 11:28 555次阅读
    <b class='flag-5'>北京大学</b>首次硬件实现电容耦合的VO2相变振荡动力学计算系统

    北京大学其鲁谈:电池新材料的当下和未来

    电池“达沃斯”-电池百人会12月5日讯“我认为我国已经跨入新的锂电池应用时代,就是储能时代。”北京大学教授、中关村新型电池技术创新联盟理事长其鲁表示,“从明年开始,储能时代就要从中国开始走向世界。但是,有几个问题如果不能解决好,可能也会产生很多起起伏伏。”
    的头像 发表于 12-08 10:00 628次阅读

    AD9826存偏置电压不为0,并且一致性较差的原因?

    我这边做了批包含AD9826芯片的板卡,实测本底暗信号幅度都是样的,对应到AD9826应该是3000的DN值。但是AD9826采集出来不一致,变化从1500~4800。板卡更换AD9826芯片,暗信号DN值立马跟着改变。请问
    发表于 12-01 06:33

    ADA4960工作在单端输入-差分输出模式下,其输出P、N之间的相位一致性该怎么测试呢?

    ADA4960 工作在单端输入-差分输出模式下,其输出P、N之间的相位一致性该怎么测试呢? 我使用矢量网络分析仪进行测试,未用到的端口接50Ω负载,接线方式如下图 原理图如下:增益电阻RG=100
    发表于 11-14 06:53

    东科与北京大学成立第三代半导体联合研发中心

    9月15日,东科半导体(安徽)股份有限公司与北京大学共同组建的第三代半导体联合研发中心正式揭牌成立。由北京大学科学研究部谢冰部长及马鞍山市委书记袁方共同为北大-东科联合研发中心揭牌。图左为袁方书
    的头像 发表于 09-19 10:07 631次阅读
    东科与<b class='flag-5'>北京大学</b>成立第三代半导体联合研发中心

    CCF HPC China 2023 | 超融合以太加持:北京大学高性能计算平台将迎来大提速

     8月25日,在青岛举行的全国高性能计算学术年会大会(CCF HPC China 2023)上,2023华为高性能计算解决方案分论坛同步举办。来自北京大学计算中心工程师付振新分享了“北京大学高性能
    的头像 发表于 08-25 18:10 565次阅读
    CCF HPC China 2023 | 超融合以太加持:<b class='flag-5'>北京大学</b>高性能计算平台将迎来大提速