方法很简单,根据给定一个场景的若干张图片,重构出这个场景的3D表示,然后推理的时候输入不同视角就可以合成(渲染)这个视角下的图像了。...「3D表示」有很多种形式,NeRF使用的是辐射场,然后用「体渲染」(Volume Rendering)技术,给定一个相机视角,把辐射场渲染成一张图像。选用辐射场+体渲染的原因很简单,全程可微分。...辐射场
所谓辐射场, 我们可以把它看做是一个函数:如果我们从一个角度向一个静态空间发射一条射线, 我们可以查询到这条射线在空间中每个点 的密度 , 以及该位置在射线角度 下 呈现出来的颜色 , 即 ...因此对于这个像素的颜色, 这个点的颜色的权重为 , 即光线射到这个点还剩多少光, 以及这个点的密度是多少。
那么, 我们继续观察 的表示, 它是密度在射线上的积分后, 取反后, 取指数。...从上面的分析我们可以看到,整个渲染过程无非是对射线上的采样点的颜色进行加权求和。其中权重 .
我们可以用渲染公式中对颜色加权权重 作为在对应区间采样的概率。