0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NeRF的研究目的是合成同一场景不同视角下的图像

3D视觉工坊 来源:3D视觉工坊 2023-01-29 10:54 次阅读

NeRF,即Neural Radiance Fields(神经辐射场)的缩写。研究员来自UCB、Google和UCSD

Title:NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

Paper:https://arxiv.org/pdf/2003.08934.pdf

Code:https://github.com/bmild/nerf

写这篇文章的动机是,一方面NeRF实在太重要了代表着计算机视觉、图像学结合的未来重要方向;另一方面NeRF对于计算机视觉背景的同学有一定的理解门槛,这篇文章试图以最小背景知识补充、最少理解成本为前提介绍NeRF。

整体介绍

NeRF的研究目的是合成同一场景不同视角下的图像。方法很简单,根据给定一个场景的若干张图片,重构出这个场景的3D表示,然后推理的时候输入不同视角就可以合成(渲染)这个视角下的图像了。

「3D表示」有很多种形式,NeRF使用的是辐射场,然后用「体渲染」(Volume Rendering)技术,给定一个相机视角,把辐射场渲染成一张图像。选用辐射场+体渲染的原因很简单,全程可微分。这个过程很有意思,可以理解为把一个空间朝一个方向上拍扁,空间中的颜色加权求和得到平面上的颜色。

辐射场

7979651c-9f7f-11ed-bfe3-dac502259ad0.png

体渲染

所谓体渲染,直观地说,我们知道相机的焦点,焦点和像素的连线可以连出来一条射线,我们可以对这条射线上所有的点的颜色做某种求和就可以得到这个像素的颜色值。

理论上,我们可以对这条射线经过空间上的每个点的密度(只和空间坐标相关)和颜色(同时依赖空间坐标和入射角)进行某种积分就可以得到每个像素的颜色。当每个像素的颜色都计算出来,那么这个视角下的图像就被渲染出来了。如下图所示:

7984c5e2-9f7f-11ed-bfe3-dac502259ad0.jpg

从相机焦点出发,往一个像素连出一条射线,获取射穿过空间中每个点的属性,进行积分得到这个像素的颜色

为了顺利完成上面过程,我们可能需要维护硕大无朋Tensor来表示辐射场,查表获取RGB和密度。这里一个问题是空间有多大表就有多大,同时只能是离散表示的。NeRF要做的事情是用一个神经网络来建模辐射场,这样无论空间有多大,不影响我们表示辐射场的所需要的存储量,而且这个辐射场表示是连续的:�Θ:(�,�,�,�,�)→(�,�,�,�

799646fa-9f7f-11ed-bfe3-dac502259ad0.png

79a2b46c-9f7f-11ed-bfe3-dac502259ad0.jpg

用神经网络来代替查表的方式表示辐射场

整体过程

因为神经网络是可微分的,选取的体渲染方法是可微分;体渲染得到的图片和原图计算MSE Loss。整个过程可端到端地用梯度回传来优化非常漂亮。整个训练Pipeline如下图所示:

79b9f91a-9f7f-11ed-bfe3-dac502259ad0.jpg

看到这,读者就已经大致理解NeRF的原理了,后面章节是NeRF的具体细节。

用辐射场做体渲染

前面我们已经大致理解体渲染的过程是怎么做了。可是怎么沿着射线对空间中的颜色进行积分呢?如果我们把射线看作是光线,可以直观得到这个积分要满足的两个条件:

1、一个点的密度越高,射线通过它之后变得越弱,密度和透光度呈反比

2、一个点的密度越高,这点在这个射线下的颜色反应在像素上的权重越大

79c63be4-9f7f-11ed-bfe3-dac502259ad0.png

而实际渲染过程,我们只能把射线平均分成N个小区间,每个区间随机采样一个点,对采样得到的点的颜色进行某种加权求和:

79d6a290-9f7f-11ed-bfe3-dac502259ad0.png

神经辐射场的两项优化点

Positional encoding

类似Transformer的做法,把坐标和视角用更高维度的表示作为网络输入,来解决渲染图像比较糊的问题:

79e7de2a-9f7f-11ed-bfe3-dac502259ad0.png

Hierachical volume sampling

79f73cf8-9f7f-11ed-bfe3-dac502259ad0.png

Architecture

7a0404f6-9f7f-11ed-bfe3-dac502259ad0.png

私货

无论从方法的开创性,还是发表后两年多的影响力来看。在笔者心目中,ECCV 2020的Best Paper没给NeRF,不得不说是一个遗憾。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2875

    浏览量

    107474
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100704
  • RGB
    RGB
    +关注

    关注

    4

    文章

    798

    浏览量

    58458

原文标题:都2023年了,我不允许你还不懂NeRF

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    全面总结动态NeRF

    1. 摘要 神经辐射NeRF)是种新颖的隐式方法,可以实现高分辨率的三维重建和表示。在首次提出NeRF研究之后,
    的头像 发表于 11-14 16:48 308次阅读
    全面总结动态<b class='flag-5'>NeRF</b>

    大华股份鸿鹄智能物联主机 赋能万千场景数视升级

    和技术创新,重磅推出大华鸿鹄智能物联主机(以下简称大华鸿鹄主机),赋能万千场景数视升级。 作为全球首款采用全国产化硬件鸿蒙系统物联主机,大华鸿鹄主机采用宽温设计,双板双控,具备4000+海量协议和22Tops超高算力,可满足各行业物联数据接入,
    的头像 发表于 08-15 16:01 388次阅读
    大华股份鸿鹄智能物联主机 赋能万千<b class='flag-5'>场景</b>数视升级

    电压放大器在合成射流高效掺混机理研究中的应用

    实验名称:功率放大器在合成射流高效掺混机理研究中的应用实验内容:合成射流是种新型主动流动控制技术,其主要工作原理是利用振动薄膜或活塞周期性地吹/吸流体,在孔口外形成涡环,这些涡环在自
    的头像 发表于 08-14 17:54 843次阅读
    电压放大器在<b class='flag-5'>合成</b>射流高效掺混机理<b class='flag-5'>研究</b>中的应用

    视觉新纪元:解码LED显示屏的视角、可视角、最佳视角的最终奥秘

    在璀璨夺目的LED显示屏世界里,每个绚烂画面的背后,都离不开三个关键概念:视角、可视角与最佳视角。这些术语不仅是衡量显示效果的重要标尺,也
    的头像 发表于 06-23 02:55 647次阅读
    视觉新纪元:解码LED显示屏的<b class='flag-5'>视角</b>、可<b class='flag-5'>视角</b>、最佳<b class='flag-5'>视角</b>的最终奥秘

    NVIDIA Instant NeRF将多组静态图像变为3D数字场景

    想象幅风光旖旎的画面,比如水畔的悬崖峭壁。即便只是 2D 图像,如此美景依旧令人心驰神往。如果同一画面能以 3D 效果展现,那么无需跋涉就能身临其境。
    的头像 发表于 05-07 09:15 403次阅读

    LiDAR4D:基于时空新颖的LiDAR视角合成框架

    NeRF-LiDAR将图像和点云模态整合到激光雷达合成中,而诸如LiDAR-NeRF和NFL之类的仅激光雷达的方法探索了在没有RGB图像的情
    发表于 04-10 12:34 1248次阅读
    LiDAR4D:基于时空新颖的LiDAR<b class='flag-5'>视角</b><b class='flag-5'>合成</b>框架

    中国科技少年的英雄梦想,从一场ICT大赛启程

    一场华为ICT大赛,科技少年之梦的起点与归途
    的头像 发表于 04-08 14:22 574次阅读
    中国科技少年的英雄梦想,从<b class='flag-5'>一场</b>ICT大赛启程

    什么是SLAM?基于3D高斯辐射的SLAM优势分析

    基于NeRF的SLAM算法采用全局地图和图像重建损失函数,通过可微分渲染捕获稠密的光度信息,具有高保真度。
    的头像 发表于 04-01 12:44 719次阅读

    线路板阻焊掉油:一场对性能与寿命的挑战

    线路板阻焊掉油:一场对性能与寿命的挑战
    的头像 发表于 03-14 15:23 972次阅读

    基于绿色视角的高校校园建设及能耗分析

    电子发烧友网站提供《基于绿色视角的高校校园建设及能耗分析.docx》资料免费下载
    发表于 03-12 11:07 1次下载

    电压放大器在合成射流高效掺混机理研究中的应用

    合成射流激励器的频率和电压特性(附图3)。完成合成射流激励器标定后,使用高速相机和双脉冲激光器进行粒子图像测速(PIV)实验获得流数据,以研究
    发表于 03-08 17:47

    谷歌模型合成工具怎么用

    谷歌模型合成工具主要是指Dreamfusion,这是Google的大型AI图像模型Imagen与NeRF的3D功能相结合的种技术。Dreamfusion是Dream Fields的演
    的头像 发表于 02-29 17:33 789次阅读

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地图和图像重建损失函数,通过可微分渲染捕获稠密的光度信息,具有高保真度。
    的头像 发表于 01-26 10:48 647次阅读
    基于<b class='flag-5'>NeRF</b>/Gaussian的全新SLAM算法

    基于绿色视角的高校校园建设及能耗分析

    电子发烧友网站提供《基于绿色视角的高校校园建设及能耗分析.docx》资料免费下载
    发表于 01-11 16:08 0次下载

    基于绿色视角的高校校园建设及能耗分析

    电子发烧友网站提供《基于绿色视角的高校校园建设及能耗分析.docx》资料免费下载
    发表于 01-05 11:30 0次下载