0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Aleth-NeRF:低光增强与曝光纠正的新方向!不良光照场景下的新视角合成

CVer 来源:CVer 2023-12-21 16:43 次阅读

大家好,今天要介绍的是AAAI 2024关于不良光照下NeRF新视角合成的工作Aleth-NeRF,目的在不良光照场景下(如低光照和过曝光)场景,能够从NeRF无监督增强并且生成正常光照的连贯3D scene。我们提出的方法可以对现有NeRF进行简单改进,通过引入一个Concealing Field的概念,仅用几行代码就可以使得现有的NeRF在低光照或者过曝光的情况下,进行Novel View Synthesis重建,并且实现无监督的低光增强和曝光纠正。

d929d1c2-9f51-11ee-8b88-92fbcf53809c.png

1. 方法概述:

本文提出了Aleth-NeRF模型来完成无监督低光照增强&过曝纠正和Novel View Synthesis。传统NeRF [1]是以观察者视角出发,通过设定当前位置光通量的多少来定义物体,缺乏对于光照和物体的结构,无法解释光照变换对场景的影响 [2],所以NeRF无法应用于低光照和过度曝光时候的重建。非常有趣的是古希腊人也秉持着与NeRF非常接近的世界观,古希腊人认为人的眼睛有一道视线,人们看到物体是来源于视线的累积,看不见物体是因为空气中存在遮挡。受到古希腊视觉观点的启发,我们认为在黑夜看不见物体是因为空气中存在遮挡物隐蔽场(Concealing Field),女神Aletheia象征着真实/不隐蔽,在希腊语里意为“真相”,这也是Aleth-NeRF名字的由来。因此我们通过对NeRF框架做最小改动,在NeRF模型中引入了隐蔽场的概念,可以用来有效的解释光照变换,在实际实现中只需要加入几行代码,不需要复杂的光照解构,就可以使得各种NeRF框架拥有同时处理低光和过曝光的能力,分为两组隐蔽场(voxel-wise的局部隐蔽场,以及global-wise的全局隐蔽场)。低光场景下的训练如上图(c)所示,训练阶段隐蔽场会加入到NeRF的volume rendering中参与训练低光照场景,在测试阶段隐蔽场将会被拿开rendering出正常光照场景。过曝光场景下的训练如上图(d)所示,训练阶段正常,然而测试阶段隐蔽场将会被加上用来rendering出正常光照场景。对于以上两种场景,我们都会在训练阶段给NeRF网络以及隐蔽场加入无监督损失函数来控制隐蔽场的生成。

2. 模型架构:

模型的大概结构图如下所示:

d94191e0-9f51-11ee-8b88-92fbcf53809c.png

以最经典的原始NeRF为例,局部隐蔽场通过NeRF的MLP网络产生,与原始NeRF的两个输出color和density相同,属于voxel-wise,全局隐蔽场则是一组可学习的网络参数,在每个场景下固定,属于global-wise,两组隐蔽场共同加入Volume Rendering中来衰退原有NeRF的Volume Rendering,通过Concealing Field的引入,Volume Rendering中的每个粒子受到前面粒子的遮蔽作用加强,我们通过Concealing Field这一假设来模拟黑暗的产生。与此同时,训练阶段我们也通过添加各种无监督损失函数来约束Concealing Field的生成,帮助我们更好的增强和修复不良光照场景。低光场景的训练阶段会采用引入Concealing Field的Volume Rendering公式,在测试阶段采用去掉Concealing Field的原有Volume Rendering公式,过曝场景则与之相反。

d946b5ee-9f51-11ee-8b88-92fbcf53809c.png

经过我们的实验发现, Concealing Field的生成范围和Volume Rendering中粒子Density的范围呈反比例关系,这意味着训练过程中Concealing Field更倾向于出现在没有物体的地方,与我们对Concealing Field存在空气中的假想一致。

3. 损失函数

为了保障Aleth-NeRF的无监督增强/过曝纠正,我们额外引入了几个损失函数来约束Concealing Fields的生成,首先我们把NeRF原有的MSE损失函数L_mse变换为L_it-mse,即在计算MSE损失之前先把图像过一个反向Tone曲线,因为原始MSE损失中黑暗像素往往权重过小而过曝像素往往权重较大,因此先加一个反向Tone曲线可以某种程度上做一下平衡。剩余的是三个无监督损失函数,其中包括控制总体亮度范围(Enhance Degree)的损失函数L_de和控制对比度(Contrast Degree)的损失函数L_co,以及一个Color Constancy损失函数L_cc。通过调整控制总体亮度损失函数L_de和控制对比度损失函数L_co的超参数,也可以实现不同程度的增强。

4. 数据集:

关于数据集方面,我们提出了一个成对的低光照/过曝光/正常光照的multi-view数据集(LOM数据集),以便大家进行后续研究,低光照和过曝光的图像用于训练模型,正常光照的图像用于Novel View Synthesis的验证,相比于2D图像增强以及视频增强,这一任务更具挑战性,因为需要在图像增强的同时来确保生成图像的multi-view一致性,数据集图片如下,我们通过相机采集了五个真实世界的场景 (buu, chair, sofa, bike, shrub),每个场景都包含有25~65张multi-view图像,每个图像都有三组不同曝光条件(低光照/过曝光/正常光照)。值得一提的是,此前谷歌的RAW-NeRF [3]也提供了一些真实世界的multi-view低光图片,但是RAW-NeRF关注的更多是将ISP与NeRF渲染结合,利用RAW图像的广阔色域和比特数优势来进行渲染,而并不是RGB图像增强,因此RAW-NeRF也没有对应正常光照RGB的ground truth。我们提供的LOM数据集可以从网站或Github上下载,概览如下图示:

d94b1fc6-9f51-11ee-8b88-92fbcf53809c.png

5. 实验结果

实验方面,我们把原始的NeRF模型作为baseline,除此之外我们再与现有的2D图像/视频增强方法进行了对比,与增强方法进行对比时,我们设计了两种方式,(1). 第一种是用先在低光/过曝图像上训练NeRF然后在novel view synthesis阶段把2D增强方法用作后处理,(2). 第二种是先用2D图像/视频增强方法来预处理数据集,然后在这些增强后的数据上训练NeRF。通过实验我们发现,方式(1)的缺陷在于低质量图像上训练的NeRF本身不够可靠,导致后处理增强后的结果也往往不尽如人意,容易出现低分辨率和模糊的情况,方式(2)的缺陷在于2D图像/视频增强方法往往不能保证3D multi-view的一致性,因此在不一致图像上训练的NeRF也会存在问题。总的来说,Aleth-NeRF这种end-to-end的方法能够在最终的平均指标上取得最优效果,在3D的可视化中也能保持多视角的consistency,表格与实验结果图如下。:

d965eea0-9f51-11ee-8b88-92fbcf53809c.png

d96a7c5e-9f51-11ee-8b88-92fbcf53809c.png

6. 缺陷和展望:

虽然Aleth-NeRF在低光和过曝场景实现了较好的无监督恢复,但是只是这一任务的初步探索,比如NeRF本身自带的缺陷如训练慢和场景无法泛化等,以及Aleth-NeRF还是无法解决一些非均匀光照场景与阴影场景等,还有在一些场景中,Aleth-NeRF复原的图像色彩存在偏差,有些过曝场景的恢复会丢失色彩等等。收到古希腊视觉理论,Aleth-NeRF提出了Concealing Fields概念,用一种简单直观的方式来建模黑暗,我们认为也许其他不同的黑暗建模方式也能够取到很好的效果,更有效的低光照建模也许能够克服Aleth-NeRF的不足。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    4338

    浏览量

    62734
  • 模型
    +关注

    关注

    1

    文章

    3259

    浏览量

    48907
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24730

原文标题:AAAI 2024 | Aleth-NeRF:低光增强与曝光纠正的新方向!不良光照场景下的新视角合成

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    直播预告 | 干簧技术应用:汽车行业新视角

    打开汽车应用领域新视角
    的头像 发表于 11-13 09:23 1897次阅读
    直播预告 | 干簧技术应用:汽车行业<b class='flag-5'>新视角</b>

    ADB和毯成车灯内卷新方向,DLP芯片迎来重大机遇

    融合算法,带来ADB自动遮蔽和示宽毯等创新照明功能。 ADB的命名是没有什么争议的,不过毯在很多车企那里叫法不同,也有幕和灯幕等称呼。并且,这些功能已经不再是豪华车的配置,逐渐下探到主流车型,成为车企内卷
    的头像 发表于 03-01 00:20 6123次阅读

    为什么说移动终端发展引领了半导体工艺新方向

    长期演进(LTE)等4G技术的发展,分立技术在通信领域中正变得越来越少见。事实上许多人相信,智能手机的普及敲响了手持通信产品中分立实现技术的丧钟。这也是为什么大家说,移动终端发展引领了半导体工艺新方向
    发表于 08-02 08:23

    车用电子是不是无线蓝牙应用的新方向

    车用电子是不是无线蓝牙应用的新方向?无线蓝牙技术回音消除及噪声抑制解决方案
    发表于 05-14 06:02

    照度图像增强算法

    针对照度图像反转后为与雾天图像相似的伪雾图,其雾的浓度由光照情况而非景深决定这一特点,提出一种基于物理模型的照度图像增强算法。该算法根据光照
    发表于 01-05 15:19 1次下载

    TCL洗衣机深入把握用户需求 正引领行业创新新方向

    当下,在房地产拉动减弱,消费增长放缓的经济环境,中国家电零售市场呈现“前高后”的发展趋势。洗衣机产业也已进入存量需求为主导的市场阶段,差异化产品成为市场竞争的主要途径。其中,秉承务实创新理念的TCL洗衣机深入把握用户需求,正引领行业创新
    发表于 05-15 09:04 1008次阅读

    AI技术的赋能为城市治理提供新方向

    新冠疫情的突袭为人类带来了巨大挑战,也为这些年智慧城市发展治理出了一道难题,在防控过程中暴露出了很多实际管控出现的问题,但此次疫情AI技术的赋能也为城市治理提供新方向
    的头像 发表于 11-27 09:54 1810次阅读

    医疗硬件设备行业发展的新方向

    我们通常都知道医疗产品有哪些,往往对于医疗辅助类产品慨念不明,随着我国医疗应用的逐渐认可和各诊疗阶段应用的普及,医用辅助产品已经成为医疗领域的“高需求产品”。智能化是医疗硬件设备行业发展的新方向
    的头像 发表于 08-14 16:15 5954次阅读

    高端家电下一步该如何持续发展,卡萨帝给出新方向

    展同步开启,卡萨帝鉴赏家套系亮相展会,向“世界设计之都”展示了东方美学艺术设计以及成套嵌入式高端智慧场景方案。这也为未来高端家电持续发展提供了两大新方向:一是艺术化设计,二是场景化布局。 设计
    的头像 发表于 06-07 17:02 1120次阅读

    Block nerf:可缩放的大型场景神经视图合成

    为了在大场景中应用神经辐射场(NeRF)模型,文章提出将大型场景分解为相互重叠的子场景 (block),每一个子场景分别训练,在推理时动态结
    的头像 发表于 10-19 15:15 1567次阅读

    基于BlockNeRF的大场景规模化神经视图合成

    mip-NeRF 的基础上增加了外观嵌入、曝光嵌入和位姿细化,以解决训练数据横跨数月而导致的环境变化和位姿误差。 为了保证相邻 Block-NeRF 的无缝合成,文章提出了在推理时迭
    的头像 发表于 10-19 15:15 923次阅读

    NeRF的研究目的是合成同一场景不同视角的图像

    为了顺利完成上面过程,我们可能需要维护硕大无朋Tensor来表示辐射场,查表获取RGB和密度。这里一个问题是空间有多大表就有多大,同时只能是离散表示的。NeRF要做的事情是用一个神经网络来建模辐射场
    的头像 发表于 01-29 10:54 1306次阅读

    基于通过非常稀疏的视角输入合成场景的方法

    作者引入了一种方法,可以仅使用单个宽基线立体图像对生成新视角。在这种具有挑战性的情况,3D场景点只被正常观察一次,需要基于先验进行场景几何和外观的重建。作者发现从稀疏观测中生成
    的头像 发表于 06-13 09:29 710次阅读
    基于通过非常稀疏的<b class='flag-5'>视角</b>输入<b class='flag-5'>合成</b><b class='flag-5'>场景</b>的方法

    LED虚拟拍摄:电影制作与电视广播的新方向

    LED虚拟拍摄:电影制作与电视广播的新方向 随着科技的迅速进步,LED虚拟拍摄逐渐成为电影制作和电视广播的新方向。这种新型的拍摄方式借助一系列先进的技术,如XR虚拟拍摄和LED巨幕,为创作者提供了
    的头像 发表于 08-25 16:28 438次阅读

    利用PyTorch实现NeRF代码详解

    神经辐射场(NeRF)是一种利用神经网络来表示和渲染复杂的三维场景的方法。它可以从一组二维图片中学习出一个连续的三维函数,这个函数可以给出空间中任意位置和方向上的颜色和密度。通过体积渲染的技术,
    的头像 发表于 10-21 09:46 751次阅读