0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CVPR | 数字文艺复兴:NVIDIA Neuralangelo 研究重构 3D 场景

NVIDIA英伟达 来源:未知 2023-06-05 10:45 次阅读

Neuralangelo 是 NVIDIA Research 开发的一个全新 AI 模型,它利用神经网络进行 3D 重建,可将 2D 视频片段转换为详细的 3D 结构,为建筑物、雕塑以及其他真实物体生成逼真的虚拟复本。

就像米开朗基罗用大理石雕刻出令人惊叹、栩栩如生的雕塑一样,Neuralangelo 能生成具有复杂细节和纹理的 3D 结构。随后,创意人士可以将这些 3D 物体导入设计软件中,对其进行进一步编辑,用于艺术、视频游戏开发、机器人工业数字孪生。

Neuralangelo 将复杂材料——包括屋顶瓦片、玻璃板和光滑的大理石——的纹理从 2D 视频转换为 3D 物料的能力大大超过了以前的方法。高保真度让开发者和创意专业人士更容易进行 3D 重建,使用智能手机拍摄的视频快速为项目创建可用的虚拟物体。

NVIDIA Research 高级研究总监、上述论文的合著者刘洺堉表示:“Neuralangelo 的 3D 重建能力将使创作者受益匪浅,能够帮助他们在数字世界中重建现实世界。这个工具最终将使开发人员能够将详细的对象——无论是小雕像还是大型建筑——导入到虚拟环境中,用于电子游戏或工业数字孪生。”

在一次演示中,NVIDIA 研究人员展示了该模型如何重建米开朗基罗“大卫像”这样的标志性物体以及平板卡车这样的普通物体。Neuralangelo 还可以重建建筑物的内部和外部——以 NVIDIA 湾区办公园区的详细 3D 模型为例进行了演示。

在 3D 中应用神经渲染模型

之前用于重建 3D 场景的 AI 模型很难准确捕捉重复的纹理、均匀的颜色和强烈的颜色变化。Neuralangelo 采用即时神经图形基元——即 NVIDIA Instant NeRF 背后的技术——来帮助捕捉这些更精细的细节。

使用从不同角度拍摄的物体或场景的 2D 视频,该模型会选择从不同角度捕捉的镜头来确定物体或场景的深度、大小和形状,就像艺术家会从多个角度描绘一个物体一样。

一旦确定了每个镜头的相机位置,Neuralangelo 的 AI 就会创建一个粗略的 3D 场景,相当于雕塑家开始雕刻主体的形状。

然后,该模型对渲染进行优化以锐化细节,就好像雕塑家辛苦雕琢石头来模仿织物或人的纹理。

最终会生成一个 3D 物体或大规模场景,可用于虚拟现实应用、数字孪生或机器人开发。

在 6 月18-22 日举行的 CVPR 大会上

探寻 NVIDIA Research 的研究成果

在 6 月 18 日至 22 日于温哥华举行的 CVPR 上,NVIDIA Research 将展示近 30 个项目,其中包括 Neuralangelo。这些论文的主题涵盖姿态估计、3D 重建和视频生成。

其中一个名为 DiffCollage 的项目是一种创建大规模内容的扩散法,包括长横向、360 度全景图和循环运动图像。当输入一个具有标准长宽比的图像训练数据集时,DiffCollage 将这些较小的图像视为更大视觉片段的一部分——就像一张张拼贴画。这使得扩散模型能够生成看上去有凝聚力的大型内容,而无需使用相同比例的图像进行训练。

该技术还可以将文本提示转换为视频序列,技术演示中使用了预先训练的扩散模型来捕捉人体动作:

点击“阅读原文”,了解有关 NVIDIA Research 参展 CVPR 的更多信息

扫描下方海报二维码,观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


原文标题:CVPR | 数字文艺复兴:NVIDIA Neuralangelo 研究重构 3D 场景

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3720

    浏览量

    90658

原文标题:CVPR | 数字文艺复兴:NVIDIA Neuralangelo 研究重构 3D 场景

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    3D扫描与数字拓片:打造文化遗产的数字复本

    ,还可以做到真正的无接触、高精度。 数字拓片可以应用于打印复印、数字化展示、教育研究等方面。本文将带您走进数字拓片的世界,探索3D扫描技术如
    的头像 发表于 10-31 17:22 105次阅读
    <b class='flag-5'>3D</b>扫描与<b class='flag-5'>数字</b>拓片:打造文化遗产的<b class='flag-5'>数字</b>复本

    中兴通讯全场景AI终端应用与裸眼3D新品亮相

    ”的产品战略与理念,终端业务六大AI主题展示吸引了众多关注,内容覆盖全球领先的AI裸眼3D、AI同声传译和方言互译、AI安全反诈、AI智慧商务和创作、红魔AI游戏魔方以及AI魔法影像等应用和产品。在此
    的头像 发表于 10-15 10:00 567次阅读

    3D ToF三维场景距离(景深)测量系统简介

    电子发烧友网站提供《3D ToF三维场景距离(景深)测量系统简介.pdf》资料免费下载
    发表于 09-29 10:55 0次下载
    <b class='flag-5'>3D</b> ToF三维<b class='flag-5'>场景</b>距离(景深)测量系统简介

    使用NVIDIA Edify助力的服务创建3D资产和虚拟环境照明

    使用 NVIDIA Edify 助力的服务创建 3D 资产和虚拟环境照明,或是减半生成图像时间。
    的头像 发表于 08-02 15:22 391次阅读

    3d场景建模可视化,场景1:1还原

    在当今数字化时代,3D场景建模可视化技术成为重要工具,为各行业提供了强大的展示和交互手段。从电影特效到建筑设计,从游戏开发到虚拟现实,3D场景
    的头像 发表于 07-12 14:49 202次阅读

    OpenCV携Orbbec 3D相机亮相CVPR 2024,加速AI视觉创新

    在科技发展的浪潮中,一年一度的IEEE国际计算机视觉与模式识别会议(CVPR)无疑是视觉技术领域的一大盛事。今年的CVPR 2024于6月17日至21日在美国西雅图盛大举行,吸引了全球超过1.2万名参会者,这一数字打破了历史记录
    的头像 发表于 06-21 10:15 545次阅读

    OpenCV携奥比中光3D相机亮相CVPR 2024

    6月17日-21日,奥比中光合作伙伴OpenCV携Orbbec 3D相机参展在美国西雅图举办的CVPR 2024(即IEEE国际计算机视觉与模式识别会议),让开发者亲身体验Orbbec 3D相机
    的头像 发表于 06-21 09:38 471次阅读

    NVIDIA Instant NeRF将多组静态图像变为3D数字场景

    想象一幅风光旖旎的画面,比如水畔的悬崖峭壁。即便只是 2D 图像,如此美景依旧令人心驰神往。如果同一画面能以 3D 效果展现,那么无需跋涉就能身临其境。
    的头像 发表于 05-07 09:15 370次阅读

    NVIDIA生成式AI研究实现在1秒内生成3D形状

    NVIDIA 研究人员使 LATTE3D (一款最新文本转 3D 生成式 AI 模型)实现双倍加速。
    的头像 发表于 03-27 10:28 451次阅读
    <b class='flag-5'>NVIDIA</b>生成式AI<b class='flag-5'>研究</b>实现在1秒内生成<b class='flag-5'>3D</b>形状

    Nullmax提出多相机3D目标检测新方法QAF2D

    今天上午,计算机视觉领域顶会CVPR公布了最终的论文接收结果,Nullmax感知部门的3D目标检测研究《Enhancing 3D Object Detection with 2
    的头像 发表于 02-27 16:38 1047次阅读
    Nullmax提出多相机<b class='flag-5'>3D</b>目标检测新方法QAF2<b class='flag-5'>D</b>

    3D HMI应用场景和发展趋势

    人机交互的革命性趋势。本文将探讨3DHMI设计的概念、优势、应用场景以及未来发展趋势。3DHMI设计的概念3DHMI设计是一种基于三维界面和人机交互的设计理念。它利用
    的头像 发表于 02-19 13:27 977次阅读
    <b class='flag-5'>3D</b> HMI应用<b class='flag-5'>场景</b>和发展趋势

    如何搞定自动驾驶3D目标检测!

    可用于自动驾驶场景下基于图像的3D目标检测的数据集总结。其中一些数据集包括多个任务,这里只报告了3D检测基准(例如KITTI 3D发布了超过40K的图像,其中约15K用于
    发表于 01-05 10:43 533次阅读
    如何搞定自动驾驶<b class='flag-5'>3D</b>目标检测!

    阿迪达斯与 Covision Media 使用 AI 和 NVIDIA RTX 创建逼真的 3D 内容

    Covision Media 正在使用 AI 和 NVIDIA RTX 改进 3D 扫描流程和 3D 内容创建。 Covis
    的头像 发表于 11-28 18:45 599次阅读
    阿迪达斯与 Covision Media 使用 AI 和 <b class='flag-5'>NVIDIA</b> RTX 创建逼真的 <b class='flag-5'>3D</b> 内容

    HT for Web (Hightopo) 使用心得(4)- 3D 场景 Graph3dView 与 Obj 模型

    这里我们通过代码建立一个 3D 场景并添加一个 Obj 模型来介绍一下 HT for Web 在 3D 场景和模型加载方面的使用。
    的头像 发表于 11-20 11:05 706次阅读
    HT for Web (Hightopo) 使用心得(4)- <b class='flag-5'>3D</b> <b class='flag-5'>场景</b> Graph<b class='flag-5'>3</b>dView 与 Obj 模型

    基于深度学习的3D点云实例分割方法

    3D实例分割(3DIS)是3D领域深度学习的核心问题。给定由点云表示的 3D 场景,我们寻求为每个点分配语义类和唯一的实例标签。
    发表于 11-13 10:34 2092次阅读
    基于深度学习的<b class='flag-5'>3D</b>点云实例分割方法