0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

北京大学提出Repaint123:纹理质量、多视角一致性新SOTA!

CVer 来源:量子位(QbitAI) 2024-01-08 16:13 次阅读

只需两分钟,玩转图片转3D!

还是高纹理质量、多视角高一致性的那种。

3d6cab32-ade4-11ee-8b88-92fbcf53809c.gif

不管是什么物种,输入时的单视图图像还是这样婶儿的:

3d830f76-ade4-11ee-8b88-92fbcf53809c.png

两分钟后,3D版大功告成:

3d8d682c-ade4-11ee-8b88-92fbcf53809c.gif

△上,Repaint123(NeRF);下,Repaint123(GS)

新方法名为Repaint123,核心思想是将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力相结合,来生成高质量、多视角一致的图像。

此外,该研究还引入了针对重叠区域的可见性感知自适应再绘强度的方法。

Repaint123一举解决了此前方法多视角偏差大、纹理退化、生成慢等问题。

3da395b6-ade4-11ee-8b88-92fbcf53809c.png

目前项目代码还未在GitHub公布,就有100+人赶来标星码住:

3da9aca8-ade4-11ee-8b88-92fbcf53809c.png

Repaint123长啥样?

之前,将图像转换为3D的方法通常采用Score Distillation Sampling (SDS)。尽管该方法的结果令人印象深刻,但存在一些问题,如多视角不一致、过度饱和、过度平滑的纹理以及生成速度缓慢。

3db18fae-ade4-11ee-8b88-92fbcf53809c.gif

△从上至下:输入,Zero123-XL,Magic123,Dream gaussian

为了解决这些问题,来自北京大学、鹏城实验室、新加坡国立大学、武汉大学的研究人员提出了Repaint123。

3e851694-ade4-11ee-8b88-92fbcf53809c.png

总的来说,Repaint123有这几点贡献:

(1)Repaint123通过综合考虑图像到3D生成的可控重绘过程,能够生成高质量的图片序列,并确保这些图片在多个视角下保持一致。

(2)Repaint123提出了一个简单的单视图3D生成的基准方法。

在粗模阶段,它利用Zero123作为3D先验,并结合SDS损失函数,通过优化Gaussian Splatting几何,快速生成粗糙的3D模型(仅需1分钟)。

在细模阶段,它采用Stable Diffusion作为2D先验,并结合均方误差(MSE)损失函数,通过快速细化网格纹理,生成高质量的3D模型(同样只需1分钟)。

(3)大量的实验证明了Repaint123方法的有效性。它能够在短短2分钟内,从单张图像中生成与2D生成质量相匹配的高质量3D内容。

3e894bd8-ade4-11ee-8b88-92fbcf53809c.png

△实现3D一致且高质量的单视角3D快速生成

下面来看具体方法。

Repaint123专注于优化mesh细化阶段,其主要改进方向涵盖两个方面:生成具有多视角一致性的高质量图像序列以及实现快速而高质量的3D重建。

1、生成具有多视角一致性的高质量图像序列

生成具有多视角一致性的高质量图像序列分为以下三个部分:

3e8e6fa0-ade4-11ee-8b88-92fbcf53809c.png

△多视角一致的图像生成流程

DDIM反演

为了保留在粗模阶段生成的3D一致的低频纹理信息,作者采用了DDIM反演将图像反演到确定的潜在空间,为后续的去噪过程奠定基础,生成忠实一致的图像。

可控去噪

为了在去噪阶段控制几何一致性和长程纹理一致性,作者引入了ControlNet,使用粗模渲染的深度图作为几何先验,同时注入参考图的Attention特征进行纹理迁移。

此外,为了执行无分类器引导以提升图像质量,论文使用CLIP将参考图编码为图像提示,用于指导去噪网络

重绘

渐进式重绘遮挡和重叠部分为了确保图像序列中相邻图像的重叠区域在像素级别对齐,作者采用了渐进式局部重绘的策略。

在保持重叠区域不变的同时,生成和谐一致的相邻区域,并从参考视角逐步延伸到360°。

然而,如下图所示,作者发现重叠区域同样需要进行细化,因为在正视时之前斜视的区域的可视分辨率变大,需要补充更多的高频信息。

另外,细化强度等于1-cosθ*,其中θ*为之前所有相机视角与所视表面法向量夹角θ的最大值,从而自适应地重绘重叠区域。

3e92e94a-ade4-11ee-8b88-92fbcf53809c.png

△相机视角与细化强度的关系

为了选择适当的细化强度,以在提高质量的同时保证忠实度,作者借鉴了投影定理和图像超分的思想,提出了一种简单而直接的可见性感知的重绘策略来细化重叠区域。

2、快速且高质量的3D重建

正如下图所展示的,作者在进行快速且高质量的3D重建过程中,采用了两阶段方法。

3e9e61ee-ade4-11ee-8b88-92fbcf53809c.png

△Repaint123两阶段单视角3D生成框架

首先,他们利用Gaussian Splatting表示来快速生成合理的几何结构和粗糙的纹理。

同时,借助之前生成的多视角一致的高质量图像序列,作者能够使用简单的均方误差(MSE)损失进行快速的3D纹理重建。

一致性、质量和速度最优

研究人员对多个单视图生成任务的方法进行了比较。

3ea2ed04-ade4-11ee-8b88-92fbcf53809c.png

△单视图3D生成可视化比较

在RealFusion15和Test-alpha数据集上,Repaint123取得了在一致性、质量和速度三个方面最领先的效果。

3ea7db98-ade4-11ee-8b88-92fbcf53809c.png

同时,作者也对论文使用的每个模块的有效性以及视角转动增量进行了消融实验:

3eac0592-ade4-11ee-8b88-92fbcf53809c.png

3eb48456-ade4-11ee-8b88-92fbcf53809c.png

并且发现,视角间隔为60度时,性能达到峰值,但视角间隔过大会减少重叠区域,增加多面问题的可能性,所以40度可作为最佳视角间隔。

3eb9b188-ade4-11ee-8b88-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2921

    浏览量

    108141
  • 图像
    +关注

    关注

    2

    文章

    1089

    浏览量

    40605
  • 模型
    +关注

    关注

    1

    文章

    3373

    浏览量

    49320

原文标题:1张图2分钟转3D!北京大学提出Repaint123:纹理质量、多视角一致性新SOTA!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    请问如何保证片AD1278的通道之间相位一致性

    读取手册,发现要保证片AD1278的通道之间相位一致性需要两点:1、CLK一致;2、SYNC_N同时拉高。 我的情况: 1、各个AD1278的CLK来着不同的时钟源,即分别采用10ppm
    发表于 01-14 06:02

    一致性测试系统的技术原理和也应用场景

    一致性测试广泛应用于各种通信协议、网络设备和系统的验证中,以确保它们能够按照既定的标准正常工作。以下是些典型的应用场景: CAN FD网络:在CAN FD网络中,各节点的质量一致
    发表于 11-01 15:35

    异构计算下缓存一致性的重要

    在众多回复中,李博杰同学的回答被认为质量最高。他首先将缓存一致性分为两个主要场景:是主机内CPU与设备间的一致性;二是跨主机的一致性
    的头像 发表于 10-24 17:00 823次阅读
    异构计算下缓存<b class='flag-5'>一致性</b>的重要<b class='flag-5'>性</b>

    RISC-V AI技术正式纳入北京大学研究生课程

    希姆计算与北京大学达成SOC课程合作2024年10月14日,希姆计算的范福杰博士走进北京大学集成电路学院的研究生课堂,为同学们讲授了节生动的《现代SoC芯片架构设计实验课程》。RISC-V走进北大
    的头像 发表于 10-18 08:09 514次阅读
    RISC-V AI技术正式纳入<b class='flag-5'>北京大学</b>研究生课程

    级联一致性和移相器校准应用手册

    电子发烧友网站提供《级联一致性和移相器校准应用手册.pdf》资料免费下载
    发表于 08-29 10:48 0次下载
    级联<b class='flag-5'>一致性</b>和移相器校准应用手册

    LIN一致性测试规范2.1

    电子发烧友网站提供《LIN一致性测试规范2.1.pdf》资料免费下载
    发表于 08-15 17:14 3次下载

    铜线键合焊接一致性:如何突破技术瓶颈?

    在微电子封装领域,铜线键合技术以其低成本、高效率和良好的电气性能等优势,逐渐成为芯片与基板连接的主流方式。然而,铜线键合过程中的焊接一致性问题是制约其进步发展和应用的关键难题。焊接一致性不仅
    的头像 发表于 07-04 10:12 1972次阅读
    铜线键合焊接<b class='flag-5'>一致性</b>:如何突破技术瓶颈?

    引领高校原生人才新生态 北京大学鲲鹏昇腾科教创新卓越中心正式成立

    6月22日,北京大学与华为技术有限公司在北京签署合作协议,“北京大学 鲲鹏昇腾科教创新卓越中心”(以下简称“卓越中心”)正式成立揭牌。双方将围绕卓越中心着力推动科研平台建设,基于鲲鹏昇腾技术路线,在
    的头像 发表于 06-25 16:23 471次阅读
    引领高校原生人才新生态 <b class='flag-5'>北京大学</b>鲲鹏昇腾科教创新卓越中心正式成立

    为什么主机厂愈来愈重视CAN一致性测试?

    新能源汽车迅猛发展下整车CAN网络架构日益复杂,总线故障等潜在问题时刻影响着运行安全。整车零部件通过CAN一致性测试必将是安全保障的第道门槛。CAN一致性测试,就是要求整车CAN网络中的节点都满足
    的头像 发表于 05-29 08:24 1294次阅读
    为什么主机厂愈来愈重视CAN<b class='flag-5'>一致性</b>测试?

    润石科技董事长参加北京大学集成电路学院“未名·芯”论坛

    2024年5月5日,在纪念五四运动105周年,也是北京大学建校126周年之际,润石科技董事长张明先生受北京大学集成电路学院校友返校、共叙情谊活动邀请
    的头像 发表于 05-11 14:06 1263次阅读

    北京大学-知存科技存算体联合实验室揭牌,开启知存科技产学研融合战略新升级

    、知存科技首席科学家郭昕婕博士及企业研发相关负责人参加了现场揭牌仪式。面向模态大模型时代产业发展新需求,双方将携手踏上探索存算体技术前沿发展和应用的新征程。     北京大学集成电路学院院长蔡
    的头像 发表于 05-07 19:31 1556次阅读
    <b class='flag-5'>北京大学</b>-知存科技存算<b class='flag-5'>一</b>体联合实验室揭牌,开启知存科技产学研融合战略新升级

    北京大学高性能计算综合能力竞赛圆满结束

    22名。第北京大学高性能计算综合能力竞赛面向全国高校在校同学,致力于激发同学们的创新意识,培养运用高性能计算技术解决复杂问题的能力,以全新的科技视角去探索前沿
    的头像 发表于 04-14 08:34 1010次阅读
    <b class='flag-5'>北京大学</b>高性能计算综合能力竞赛圆满结束

     QSFP一致性测试的专业测试设备

    QSFP一致性测试是确保QSFP光模块性能稳定、可靠的关键环节,对于保障通信系统的正常运行具有重要意义。QSFP(Quad Small Form-factor Pluggable)光模块是种高密度
    的头像 发表于 03-14 10:40 702次阅读
     QSFP<b class='flag-5'>一致性</b>测试的专业测试设备

    企业数据备份体系化方法论的七大原则:深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用一致性和崩溃一致性,常常被误解或混淆。本文旨在阐明这两个概念的差异,并分析它们在数据备份中的重要,以便读者
    的头像 发表于 03-11 14:05 541次阅读
    企业数据备份体系化方法论的七大原则:深入理解数据备份的关键原则:应用<b class='flag-5'>一致性</b>与崩溃<b class='flag-5'>一致性</b>的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别 在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用一致性和崩溃一致性,常常被误解或混淆。
    的头像 发表于 03-11 11:29 1043次阅读
    深入理解数据备份的关键原则:应用<b class='flag-5'>一致性</b>与崩溃<b class='flag-5'>一致性</b>的区别