differentiable rendering小结

Peter Lu

发布于 2020-12-17 17:09:09

2.3K0

发布于 2020-12-17 17:09:09

文章被收录于专栏：LETLET

简介

渲染可以分为forward和inverse两种方式，如图所示，当我们有了床的模型，灯光和相机视角后，可以渲染出一张图像。理论上，如果我们获取了该方法的反函数，就可以基于图像获取原始参数。之前一系列小结告诉我们，f方法复杂(light transport & material)，计算量很大，无法直接算出这个反函数。于是，退而求其次，我们如果能够获取该函数对应参数x的导数，就可以不断的迭代来拟合，最终得到误差在允许范围内的x的近似值。因此，问题转化为如何求解函数的导数，这就是可微分渲染领域的核心问题。

可以说，这个工作是视觉在更下一层的延伸，传统的视觉受限于计算量，都是针对图像的理解，而现在，我们希望能够更进一步，能够针对这些参数化属性的理解。

微分渲染能够帮助我们更好的解决很多现实的问题。

如图的光照分析，根据建筑物布局，阳光的位置，量化室内的光照亮，方便后续的照明系统设置。

比如3D打印，打印的材料通常都是半透明材质，因此内部会有散射，这样，某一点的颜色不仅仅取决于该点自己的颜色，而是和周围效果的融合，因此会有失真的问题，而微分渲染可以在forward和inverse之间不断微调模拟，获取更佳的打印参数。

光蚀设计，当我们把平行光打到一块玻璃上，希望能够折射出期望的图像

Auto differentiable

为了实现可微分渲染，首先，我们需要能计算一个函数的导数，最直接的方式就是手动推导，这种方式的好处是准确，一旦计算出公式后，计算非常的高效，但如果函数非常复杂，这个推导很麻烦，也容易出错，通常，手动推导不太适合解决实际中的复杂问题，能用体力解决的就不要靠智力。因此，目前主流的是auto diff，大概思路就是引入一个增量ε，计算其导数，问题是如何设置ε的大小会影响其精度，但确实就是纯算，没有太多技术含量。

Auto diff又分为forward和backward两种方式，举个例子，假设有x0，x1，y0，y1，z0这样一个graph：

在forward中，需要

和

，以及

和

，然后利用chain rule得到

。同理计算

，总计需要8次，有重复计算。

而在backward中则可以避免重复计算，我们先计算

和

，然后再计算

和

，以及

和

，没有重复，只有6次。缺点是会占用较多的内存存储中间变量。目前，auto diff通常采用backward方式，先根据函数构建graph，然后求导，这一部分也有很多内容，比如通过元编程等template技术在编译器求导的方式，来降低运行期的计算量。

基于这个例子，我们假设z0是一件工艺品，需要2个y0（假设是钉子）和3个y1（假设是螺丝），其中，一个钉子是0.8元，一个螺丝是0.5元，所以z0价值是：

假设我们只知道z0的成本（target）是3.1，不知道钉子和螺丝的成本，我们给一个初始值，认为它们分别都是1元：

我们设置一个learning rate 是0.1，根据如上的公式更新每个单位的成本，得到如下：

依次继续迭代，我们就可以不断缩小和期望值target之间的差距，也就能够获取较为准确的单位成本，在不陷入local minimum的前提下。

该例子对应的数学推导也不难理解，比如我们构建了一个loss function，如下：

这样，我们针对每一种材料的权重求导：

设置一个合适的learning rate ε，我们可以得到：

如上，就是一个简单的backpropagation的过程，在微分渲染中，我们认为影像类似钉子和螺丝这一层，它们也要依赖最终的x0（原材料）和x1（打工人）等更底层的参数，我们希望能够通过chain rule进一步的了解x层对应的权重，这也是为什么之前说，之前的CV直接使用影像，并没有把渲染的过程包含进去，而微分渲染则提供了这种能力，进而更精确的理解图像。

differentiable rendering

我们先适度装个逼，提出一个问题，空间是连续的吗？这是一个很有意思的问题，普朗克尺度下空间是离散的，而一个光子的能量跟普朗克成正比，从这个角度，radiance在空间中的分布也应该是离散的。

我们看下面这个例子

很显然，被积函数是不连续的（x==p时），但如下求导也成立：

而渲染中，一个像素对应的颜色是该像素区域内所有颜色的均值。所以，尽管一条光路不一定是连续的，但整个积分下则是连续的。The integrand of rendering is discontinuous and not differentiable, but the integral is actually differentiable。这也是可微分渲染的理论基础。

接下来，问题变成了如何对积分求导，如下是对应的数学推导，分为连续区间下和非连续的部分。

下面我们试着在渲染中运用该思路。

如上是Primary visibility的情况，也就是和相机相连的ray对应的渲染效果，类似一面白墙，然后左上部分是绿色的，上图是交界处的一个像素的效果。这里，我们设置一个half-plane函数，作为Heaviside step function (对其求导则是一个Dirac delta function)的参数：