0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA提出Magic3D:高分辨率文本到3D内容创建

CVer 来源:机器之心 作者:机器之心 2022-11-25 11:33 次阅读

英伟达进入 AI 生成模型领域的研究,直接比别人多一个次元:一句描述生成 3D 模型。

我们生活在三维的世界里,尽管目前大多数应用程序是 2D 的,但人们一直对 3D 数字内容有很高的需求,包括游戏、娱乐、建筑和机器人模拟等应用。

然而,创建专业的 3D 内容需要很高的艺术与审美素养和大量 3D 建模专业知识。人工完成这项工作需要花费大量时间和精力来培养这些技能。

需求大又是「劳动密集型行业」,那么有没有可能交给 AI 来做?上周五,英伟达提交到预印版论文平台 arXiv 的论文引起了人们的关注。

和现在流行的 NovelAI 差不多,人们只需要输入一段文字比如「一只坐在睡莲上的蓝色箭毒蛙」,AI 就能给你生成个纹理造型俱全的 3D 模型出来。

d643de04-6c11-11ed-8abf-dac502259ad0.gif

Magic3D 还可以执行基于提示的 3D 网格编辑:给定低分辨率 3D 模型和基本提示,可以更改文本从而修改生成的模型内容。此外,作者还展示了保持画风,以及将 2D 图像样式应用于 3D 模型的能力。

d6bb92e6-6c11-11ed-8abf-dac502259ad0.gif

Stable Diffusion 的论文在 2022 年 8 月才首次提交,几个月就已经进化到这样的程度,不禁让人感叹科技发展的速度。

英伟达表示,你只需要在这个基础上稍作修改,生成的模型就可以当做游戏或 CGI 艺术场景的素材了。

3D 生成模型的方向并不神秘,其实在 9 月 29 日,谷歌曾经发布过一款文本到 3D 的生成模型 DreamFusion,英伟达在 Magic3D 的研究中直接对标该方法。

d7690e3a-6c11-11ed-8abf-dac502259ad0.gif

类似于 DreamFusion 用文本生成 2D 图像,再将其优化为体积 NeRF(神经辐射场)数据的流程,Magic3D 使用两阶段生成法,用低分辨率生成的粗略模型再优化到更高的分辨率。

英伟达的方法首先使用低分辨率扩散先验获得粗糙模型,并使用稀疏 3D 哈希网格结构进行加速。用粗略表示作为初始,再进一步优化了带纹理的 3D 网格模型,该模型具有与高分辨率潜在扩散模型交互的高效可微分渲染器。

Magic3D 可以在 40 分钟内创建高质量的 3D 网格模型,比 DreamFusion 快 2 倍(后者平均需要 1.5 小时),同时还实现了更高的分辨率。统计表明相比 DreamFusion,61.7% 的人更喜欢英伟达的新方法。

连同图像调节生成功能,新技术为各种创意应用开辟了新途径。

d7cec5cc-6c11-11ed-8abf-dac502259ad0.png

论文链接:https://arxiv.org/abs/2211.10440

技术细节

Magic3D 可以在较短的计算时间内根据文本 prompt 合成高度详细的 3D 模型。Magic3D 通过改进 DreamFusion 中的几个主要设计选择来使用文本 prompt 合成高质量的 3D 内容。

具体来说,Magic3D 是一种从粗到精的优化方法,其中使用不同分辨率下的多个扩散先验来优化 3D 表征,从而生成视图一致的几何形状以及高分辨率细节。Magic3D 使用监督方法合成 8 倍高分辨率的 3D 内容,速度也比 DreamFusion 快 2 倍。

Magic3D 的整个工作流程分为两个阶段:在第一阶段,该研究优化了类似于 DreamFusion 的粗略神经场表征,以实现具有基于哈希网格(hash grid)的内存和计算的高效场景表征。

在第二阶段该方法切换到优化网格表征。这个步骤很关键,它允许该方法在高达 512 × 512 的分辨率下利用扩散先验。由于 3D 网格适用于快速图形渲染,可以实时渲染高分辨率图像,因此该研究利用基于光栅化的高效微分渲染器和相机特写来恢复几何纹理中的高频细节。

d803fd1e-6c11-11ed-8abf-dac502259ad0.png

基于上述两个阶段,该方法可以生成高保真的 3D 内容,并且很容易在标准图形软件中导入和可视化。

此外,该研究展示了用文本 prompt 对 3D 合成过程的创造性控制能力,如下图 1 所示。

d84e0954-6c11-11ed-8abf-dac502259ad0.png

为了对比实际应用效果,英伟达的研究人员把 Magic3D 和 DreamFusion 在 397 个文本提示生成的内容上进行了比较。平均的粗略模型生成阶段花费 15 分钟,精细阶段训练了 25 分钟,所有运行时间均在 8 块英伟达 A100 GPU 上测得。

d898c886-6c11-11ed-8abf-dac502259ad0.png

d8d9953c-6c11-11ed-8abf-dac502259ad0.png

虽然论文和 demo 只是第一步,但英伟达已经为 Magic3D 想好了未来的应用方向:给游戏和元宇宙世界提供制作海量 3D 模型的工具,而且让所有人都可以上手使用。

当然,最早上线这项功能的可能会是英伟达自己的 Omniverse。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2861

    浏览量

    107312
  • NVIDIA
    +关注

    关注

    14

    文章

    4930

    浏览量

    102794
  • AI
    AI
    +关注

    关注

    87

    文章

    30095

    浏览量

    268362

原文标题:一句话生成3D模型!NVIDIA提出Magic3D:高分辨率文本到3D内容创建

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    使用DM642 DSP和THS8200驱动器的高分辨率视频

    电子发烧友网站提供《使用DM642 DSP和THS8200驱动器的高分辨率视频.pdf》资料免费下载
    发表于 10-17 11:43 0次下载
    使用DM642 DSP和THS8200驱动器的<b class='flag-5'>高分辨率</b>视频

    高分辨率风速计

    电子发烧友网站提供《高分辨率风速计.pdf》资料免费下载
    发表于 09-24 11:30 0次下载
    <b class='flag-5'>高分辨率</b>风速计

    高分辨率音频和传统音频区别

    高分辨率音频通过更高的采样和比特深度,提供了更高的音质和更丰富的听觉体验,而传统音频则可能在音质和细节上有所妥协。
    的头像 发表于 09-04 16:20 431次阅读
    <b class='flag-5'>高分辨率</b>音频和传统音频区别

    鼎阳科技|高分辨率产品增长39.42%,引领高端市场新浪潮!

    20%以上,高端化进程再加速;高分辨率数字示波器产品境内收入同比增长39.42%,竞争优势明显。   一、高分辨率示波器增长39.42%,核心产品优势突出 当前,示波器高分辨率化已成趋势。报告期内,鼎阳科技共发布了4款新产品,其
    发表于 08-30 16:46 319次阅读
    鼎阳科技|<b class='flag-5'>高分辨率</b>产品增长39.42%,引领高端市场新浪潮!

    什么是高分辨率示波器?它有哪些优势?

    高分辨率示波器是一种在信息与系统科学相关工程与技术领域中广泛应用的科学仪器,其设计旨在提供更高的信号分辨率和更精细的信号分析能力。以下是对高分辨率示波器的详细解析,包括其定义、优势以及可能涉及的多个方面。
    的头像 发表于 08-08 11:49 829次阅读

    使用NVIDIA Edify助力的服务创建3D资产和虚拟环境照明

    使用 NVIDIA Edify 助力的服务创建 3D 资产和虚拟环境照明,或是减半生成图像时间。
    的头像 发表于 08-02 15:22 427次阅读

    Moritex 5X 高分辨率远心镜头 助力晶圆检测

    5X高分辨率远心镜头工业镜头相当于机器视觉系统中的眼睛,它能将目标成像在图像传感器的光敏面上,对视觉图像成像发挥着重要作用。今天我们来看看Moritex的5X高分辨率远心镜头
    的头像 发表于 07-27 10:00 275次阅读
    Moritex 5X <b class='flag-5'>高分辨率</b>远心镜头 助力晶圆检测

    机载单光子激光雷达系统用于实现高分辨率3D成像

    据麦姆斯咨询报道,近日,中国科学技术大学合肥微尺度物质科学国家研究中心的研究团队开发出了一种结构紧凑、重量轻的单光子机载激光雷达系统,可以用低功率激光获取高分辨率3D图像。
    的头像 发表于 05-06 09:05 790次阅读
    机载单光子激光雷达系统用于实现<b class='flag-5'>高分辨率</b><b class='flag-5'>3D</b>成像

    NVIDIA生成式AI研究实现在1秒内生成3D形状

    NVIDIA 研究人员使 LATTE3D (一款最新文本3D 生成式 AI 模型)实现双倍加速。
    的头像 发表于 03-27 10:28 464次阅读
    <b class='flag-5'>NVIDIA</b>生成式AI研究实现在1秒内生成<b class='flag-5'>3D</b>形状

    高管洞察:高分辨率音乐需要高分辨率扬声器

    希望创建一个平台,可以播放无损高分辨率(Hi-Res)的音乐,忠实于原始录音。他不仅支持高分辨率的数字内
    发表于 03-21 14:57 842次阅读
    高管洞察:<b class='flag-5'>高分辨率</b>音乐需要<b class='flag-5'>高分辨率</b>扬声器

    高分辨率音频和普通音频之间的区别

    为了满足数字媒体对质量的要求,行业已经开始采用高分辨率音频,数字内容以更高的频率采样以保持保真度,并以更大的位深捕捉更多细节。
    发表于 03-21 12:35 886次阅读
    <b class='flag-5'>高分辨率</b>音频和普通音频之间的区别

    如何使用SPU实现MUSIC或ESPRIT算法以获得超高分辨率

    如何使用SPU实现MUSIC或ESPRIT算法以获得超高分辨率? 谢谢。
    发表于 01-23 07:59

    3d光学轮廓仪测微光学器件应用及其重要意义

    3d光学轮廓仪通过利用白光的干涉和衍射现象,能够对微小的表面高度差异进行精确测量,并得出精准的尺寸和形态数据。对于超光滑透明微光学器件的测量来说,3d光学轮廓仪不仅具备高精度和高分辨率的特点,还能够快速、无损地获得物体的三维形貌
    的头像 发表于 12-29 09:28 723次阅读
    <b class='flag-5'>3d</b>光学轮廓仪测微光学器件应用及其重要意义

    鼎阳科技发布SDS800X HD高分辨率数字示波器

    高分辨率示波器具有极佳的信号检测和显示能力
    的头像 发表于 12-12 13:46 1062次阅读
    鼎阳科技发布SDS800X HD<b class='flag-5'>高分辨率</b>数字示波器

    阿迪达斯与 Covision Media 使用 AI 和 NVIDIA RTX 创建逼真的 3D 内容

    Covision Media 正在使用 AI 和 NVIDIA RTX 改进 3D 扫描流程和 3D 内容创建。 Covis
    的头像 发表于 11-28 18:45 626次阅读
    阿迪达斯与 Covision Media 使用 AI 和 <b class='flag-5'>NVIDIA</b> RTX <b class='flag-5'>创建</b>逼真的 <b class='flag-5'>3D</b> <b class='flag-5'>内容</b>