NeRF in the Wild
创始人
2024-06-02 00:01:51
0

NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections:无约束照片收集的神经辐射场
摘要:提出了一种基于学习的方法,用于仅使用野外照片的非结构化集合来合成复杂场景的新颖视图。针对NeRF无法在非受控图像中模拟许多普遍存在的真实世界现象,例如可变照明或瞬态变化(行人车辆),进行了扩展。

NeRF的局限:场景都是在一小段时间内进行拍摄,光照影响都保持不变,并且所有场景的内容都保持不变。但是野外场景中的大规模场景,其中输入图像可能相隔数小时或数年拍摄,并且可能包含行人和车辆在其中穿行。解决思路:NeRF 假设场景是在几何、材质和摄影角度上,都是静态的,即场景的密度和辐射场都是静态的。因此,NeRF 需要让两个在相同位置和朝向上,拍摄出的照片必须完全一致,NeRF-wild放宽了限制,主要解决光照变换以及移动遮挡问题
创新点
1、在学习到的低维隐空间中,建模图像外观的变化,如曝光、光照、天气和后处理,根据生成潜在优化的框架,优化每个输入图像的外观嵌入,从而赋予NeRF-W通过学习整个照片集合中的共享外观表示来解释图像之间的光度和环境变化的灵活性。学习的潜在空间提供了输出渲染外观的控制。
2、将场景建模为共享元素和图像相关元素的结合,从而使场景内容能够无监督地分解为“静态”和“瞬态”组件。使用二次体积辐射场和数据相关不确定性场对瞬态元素进行建模,其中数据相关不确定场捕获可变观测噪声,并进一步减少瞬态对象对静态场景表示的影响。

背景知识
论文中介绍了NeRF的离散公式,只不过进行了表示上的小变化
在这里插入图片描述
R(r,c,σ)\mathcal{R}(\mathbf{r}, \mathbf{c}, \sigma)R(r,c,σ)表示体渲染
α(x)=1−exp⁡(−x)\alpha(x)=1-\exp (-x)α(x)=1−exp(−x)
δk=tk+1−tk\delta_{k}=t_{k+1}-t_{k}δk​=tk+1​−tk​
ReLU MLP 来表示体积密度 σ(t)\sigma(t)σ(t) c(t)\mathbf{c}(t)c(t)
在这里插入图片描述

1、 Latent Appearance Modeling

为了使 NeRF 能够适应不同光照和摄影后处理,采用了 生成潜在优化,每张图像 Ii都会赋给一个对应的实值外观嵌入向量ℓi(a)\boldsymbol{\ell}_{i}^{(a)}ℓi(a)​,长度为n(a)n^{(a)}n(a),这类似于学习到的外观特征。如下公式中,强调了颜色c对每张图的依赖性。论文认为NeRF的c和图片标号没有关系,这里ci介入了一种像素对应图片的依赖性,每张图的外观特征由于光照时间等因素都是不一样的。在这里插入图片描述
z(t)\mathbf{z}(t)z(t)表示的是将位置输入MLP中得到的输出,将中间输出,外观特征,观看方向编码 输入MLP2中,就能得到每张照片的颜色值,C^i\hat{\mathbf{C}}_{i}C^i​表示对每张图片的依赖。

2、Transient Objects

使用两种设计来解决动态现象
1、把原始NeRF中的MLP当作静态的MLP来预估地标建筑的颜色和密度,记作静态头(head),然后再加一个瞬态头(transient head),该头部发射自己的颜色和密度,其中允许密度在训练图像中变化,这个方法的好处是能够让网络在重建后面的静态场景时不会把遮挡物的伪影加到建筑上。
2、并不假设所有观测像素颜色都是同样可靠的,允许瞬态部分发射出不确定性( uncertatinty)场(类似于颜色和密度),可以让模型调整重构损失,让网络通过损失函数忽略那些离群点(不可靠的像素和 3D 位置,这些位置很可能包含遮挡物)。
将每个像素的颜色建模为各向同性正态分布,其可能性将最大化,并使用NeRF使用的相同体积渲染方法“渲染”该分布的方差。这两个模型组件允许NeRF-W在没有明确监督的情况下解开静态和瞬态现象。
各向同性正态分布
用瞬态部分的σi(τ)(t)\sigma_{i}^{(\tau)}(t)σi(τ)​(t)和ci(τ)(t)\mathbf{c}_{i}^{(\tau)}(t)ci(τ)​(t) 来增强静态密度和亮度,下面的公式是最终的渲染公式,静态与动态相加在进行累加计算。在这里插入图片描述
优化
为了让场景的瞬态分量在不同的图像上变化,我们给每个训练图像Ii指定第二个嵌入ℓi(τ)∈Rn(τ)\ell_{i}^{(\tau)} \in \mathbb{R}^{n^{(\tau)}}ℓi(τ)​∈Rn(τ),作为瞬态 MLP 的输入,下面公式中,第三个MLP得到的输出为瞬态(前面遮挡)的密度,颜色,不确定性,不确定性经过第二行公式进行了一个变化,

在这里插入图片描述
图像 i上射线 r对真值颜色 Ci(r)的损失是,这是一个最大似然函数以及后验估计的估计(不确定性服从正态分布的情况下)
在这里插入图片描述
在这里插入图片描述
对于这里的推导可以看这个视频

下图是整体架构图在这里插入图片描述

损失函数
类似于 NeRF,我们同时优化 Fθ的两个网络:精细模型使用上述的模型和损失;粗糙模型只使用隐外观的建模分量。和参数 θ一起,我们优化每张图像的外观嵌入{ℓi(a)}i=1N\left\{\boldsymbol{\ell}_{i}^{(a)}\right\}_{i=1}^{N}{ℓi(a)​}i=1N​和瞬态嵌入{ℓi(τ)}i=1N\left\{\ell_{i}^{(\tau)}\right\}_{i=1}^{N}{ℓi(τ)​}i=1N​
,NeRF-W 的损失函数为
在这里插入图片描述

相关内容

热门资讯

纯安卓系统屏幕不亮,安卓屏幕不... 手机屏幕突然不亮了,这可怎么办呢?别急,今天就来和你聊聊纯安卓系统屏幕不亮的那些事儿。无论是工作还是...
安卓系统和ios系统流畅性,谁... 你有没有发现,手机用久了,有时候就像老牛拉车一样,慢吞吞的,让人抓狂?这不,最近我在网上看到很多人在...
华为鸿蒙是安卓系统吗,揭秘其与... 你有没有听说最近华为推出的一款操作系统——鸿蒙?是不是好奇它是不是安卓系统呢?别急,今天就来给你揭秘...
丰田亚洲龙车机安卓系统,智能驾... 亲爱的车迷朋友们,今天我要和你聊聊一款车界的明星——丰田亚洲龙,还有它那让人眼前一亮的安卓系统。想象...
怎么备份安卓系统软件 你有没有想过,如果你的安卓手机突然间“失忆”了,所有的软件和设置都消失了,那会是多么糟糕的事情啊!别...
平板安卓系统和ios系统哪个好... 你有没有想过,为什么你的朋友总是一副“我手机里的应用比你的多,我平板里的游戏比你的炫酷”的样子?这背...
外置安卓系统是什么,便携式智能... 你有没有想过,为什么你的手机可以玩那么多的游戏,看那么多的视频,却总觉得有点力不从心呢?其实,这都得...
金立咋升级安卓系统,轻松迈向新... 你有没有发现,金立手机最近好像悄悄地升级了安卓系统呢?这可真是让人眼前一亮啊!今天,就让我带你一起探...
安卓原生系统怎么分屏 你有没有想过,在安卓手机上,如何一边看视频一边回复消息呢?或者一边浏览网页一边写邮件?分屏功能简直就...
钉钉密聊安卓系统,隐私安全与便... 你知道吗?在数字化办公的世界里,钉钉这款软件可是很多人的得力助手。尤其是它的密聊功能,简直是保护隐私...
安卓系统将逐渐闭源,“安卓系统... 你知道吗?最近有个大新闻在科技圈里炸开了锅——安卓系统将逐渐闭源!这可不是闹着玩的,它可是影响着我们...
安卓车载系统支持carplay... 你有没有发现,现在开车的时候,手机和车载系统之间的互动越来越紧密了?想象一边听着动感的音乐,一边导航...
老手机升级安卓13系统,安卓1... 你那台用了好多年的手机,是不是还在用着安卓10或者11的系统呢?别急,今天就来给你揭秘如何让你的老手...
安卓系统的手机导航软件,引领您... 你有没有发现,现在出门在外,手机导航软件简直成了我们的“小向导”,无论你是去陌生的城市,还是只是想换...
安卓系统开发单位,技术革新与产... 你有没有想过,那些陪伴我们日常生活的安卓手机,背后其实有着一群默默无闻的开发团队在辛勤工作呢?他们就...
安卓系统电话区域拦截,智能守护... 你有没有遇到过那种电话,每次接起来都是推销保险的、办信用卡的,或者是那种让你帮忙填问卷的?真是烦死了...
安卓系统优酷代理使用,畅享高清... 你有没有发现,现在用安卓手机看视频,有时候会遇到播放卡顿、广告满天飞的情况?别急,今天就来给你揭秘如...
微信运动适合安卓系统,解锁健康... 你知道吗?现在手机上有个超好玩的运动应用,叫微信运动,它不仅能记录你的步数,还能和朋友们比一比谁更活...
安卓系统kodi怎么设置中文,... 你有没有发现,安卓系统上的Kodi播放器简直就是家庭影院的神器啊!不过,用起来是不是觉得有点小麻烦?...
安卓系统显示信号强度 你有没有发现,每次拿出手机,安卓系统的信号强度显示总是让人摸不着头脑?有时候信号满格,却感觉网速慢得...