如果\(arctan\)的计算成为了瓶颈,那么是时候对其进行优化了。
\(arctan\)的近似计算本质上是在所需精度范围内对\(arctan\)曲线进行拟合,比较直接的想法是泰勒展开,
\[\arctan (x)=x-\frac{x^{3}}{3}+\frac{x^{5}}{5}-\frac{x^{7}}{7}+\ldots \]
根据需要的精度,确定展开多少项,但\(arctan\)的泰勒展开在\(x\)接近1时,收敛较慢,并不高效。
另一个直接的想法是查表,根据所需精度,正切值定点化后,将其对应的角度保存成表,计算时,根据最近的正切值查表,一般需要较大的内存空间。
需要注意的是,\(arctan(x)\)返回的是\((-\pi/2, \pi/2)\), \(arctan2(y, x)\)返回的范围是\((-\pi, \pi ]\),因为后者可以根据\(x\)和\(y\)的正负确定位于哪个象限。实际上,只需近似或存储\([0, \pi/2]\)即可(即八象限中的第一象限),若输入向量\((x, y)\),根据\(x\)和\(y\)的正负和大小关系,可以折算到所有的八个象限。
此外,CORDIC(COordinate Rotation DIgital Computer)算法也是个选择,仅涉及移位和加法操作,但仍需要迭代。
这里,罗列paper 《Efficient Approximations for the Arctangent Function 》中的7种近似算法,这些近似算法通过Lagrange interpolation和minimax optimization techniques得到,最大近似误差和所需计算如下所示,
从上到下依次为,
\[\arctan (x) \approx \frac{\pi}{4} x, \quad-1 \leq x \leq 1 \]
\[\arctan (x) \approx \frac{\pi}{4} x+0.285 x(1-|x|), \quad-1 \leq x \leq 1 \]
\[\arctan (x) \approx \frac{\pi}{4} x+0.273 x(1-|x|), \quad-1 \leq x \leq 1 \]
\[\arctan (x) \approx \frac{\pi}{4} x+x\left(0.186982-0.191942 x^{2}\right), \quad-1 \leq x \leq 1 \]
\[\arctan (x) \approx \frac{\pi}{4} x-x(|x|-1)(0.2447+0.0663|x|), \quad-1 \leq x \leq 1 \]
\[\arctan (x) \approx \frac{x}{1+0.28086 x^{2}}, \quad-1 \leq x \leq 1 \]
\[\arctan (x) \approx \frac{x}{1+0.28125 x^{2}}, \quad-1 \leq x \leq 1 \]
实际使用时,可先定点化,按需选取。
以上。