pow(x,0.5f)的快速实现比快速sqrt(x)快吗？

根据提供的信息，pow(x, 0.5f) 的实现比快速sqrt(x)快。这是因为pow(x, 0.5f) 是直接计算x的平方根，而sqrt(x) 是间接计算x的平方根，涉及到的计算量更小，因此速度更快。此外，由于sqrt(x) 是更通用的函数，其实现通常比pow(x, 0.5f) 更优化，因此也更快速。

以下是pow(x, 0.5f) 的实现代码：

float x = 2.0f;
float result = x * x * 0.5f;

以下是sqrt(x) 的实现代码：

float x = 2.0f;
float result = sqrt(x);

对于更具体的场景，如果需要更快的平方根计算，可以考虑使用专门的平方根算法，例如快速平方根算法、二分平方根算法等。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

一个Sqrt函数引发的血案

我们平时经常会有一些数据运算的操作，需要调用sqrt，exp，abs等函数，那么时候你有没有想过：这个些函数系统是如何实现的？就拿最常用的sqrt函数来说吧，系统怎么来实现这个经常调用的函数呢？...比如求sqrt(16)的结果，你先试（0+16）/2=8，8*8=64，64比16大，然后就向左移，试（0+8）/2=4，4*4=16刚好，你得到了正确的结果sqrt(16)=4。...这次真的是质变了，结果竟然比系统的还要好。。。哥真的是震惊了！！！哥吐血了！！！一个函数引发了血案！！！血案，血案。。。到现在你是不是还不明白那个“鬼函数”，到底为什么速度那么快吗？...它的作用是将一个数开平方并取倒，经测试这段代码比(float)(1.0/sqrt(x))快4倍： float Q_rsqrt( float number ) { long i; float x2,...编译，实验，这个函数不仅工作的很好，而且比标准的sqrt()函数快4倍！要知道，编译器自带的函数，可是经过严格仔细的汇编优化的啊！

1.1K5 0

一个 Sqrt 函数引发的血案

我们平时经常会有一些数据运算的操作，需要调用sqrt，exp，abs等函数，那么时候你有没有想过：这个些函数系统是如何实现的？就拿最常用的sqrt函数来说吧，系统怎么来实现这个经常调用的函数呢？...比如求sqrt(16)的结果，你先试（0+16）/2=8，88=64，64比16大，然后就向左移，试（0+8）/2=4，44=16 刚好，你得到了正确的结果 sqrt(16)=4。...到现在你是不是还不明白那个“鬼函数”，到底为什么速度那么快吗？不急，先看看下面的故事吧： Quake-III Arena (雷神之锤3)是 90 年代的经典游戏之一。...它的作用是将一个数开平方并取倒，经测试这段代码比(float)(1.0/sqrt(x))快4倍： float Q_rsqrt( float number ) 2{ long i; float...编译，实验，这个函数不仅工作的很好，而且比标准的sqrt()函数快4倍！要知道，编译器自带的函数，可是经过严格仔细的汇编优化的啊！

7254 0

【像训练CNN一样快速训练RNN】全新RNN实现，比优化后的LSTM快10倍

项目已经开源：https://github.com/taolei87/sru 先看论文摘要，有个大概的了解：标题非常直接，也是很多人都想实现的——《像训练CNN一样快速训练RNN》： ?...我们所提出的循环单元，运行速度与卷积层一样快，比cuDNN优化的LSTM快5-10倍。我们展示了这种循环单元在广泛应用中的有效性，包括分类、问答、语言建模、翻译和语音识别。...我们开源了在PyTorch和CNTK中的实现。简单循环单元SRU，简化状态计算，速度与CNN一样快近来深度学习取得的许多进展都源于模型容量的增加和计算力的相应提升。...因此，SRU中的所有矩阵乘法（即gemm）和元素方面的操作可以在不同的维度和步骤中实现并行化。 SRU实现：增加highway连接和变分dropout 那么，SRU是怎么实现的呢？...然后，作者将和步骤t的神经门之间的连接全部丢弃，以这种方法来加速循环计算。相比之下，现有的RNN在实现时是要使用先前的输出状态的。

2.4K5 0

深度：震惊世间的惊人代码（附完整代码）

long i; float x2, y; const float threehalfs = 1.5F; x2 = number * 0.5F; y = number;...函数返回1/sqrt(x),这个函数在图像处理中比sqrt(x)更有用。注意到这个正数只用了一次叠代!(其实就是根本没用叠代，直接运算)。...编译、实验，这个团数不仅工作的很好，而且比标准的sqrt()函数快4倍！...囊括世界万物的一段代码这是一段使用Processing语言的代码，这短短的几行代码永无休止的就在做一件事——“穷举”。那么它又有什么特殊之处吗？...:，主要的核心代码是:|:&，可以看出这是一个函数本身的递归调用，通过&实现在后台开启新进程运行，通过管道实现进程呈几何形式增长，最后再通过:来调用函数引爆炸弹。

6101 0

大厂面试题:求根号2简单？高级算法你肯定不会

这里再补充一点，实际上x的初始值可以取任意正数，但是会影响到性能，我尝试取1亿，最终需要30次迭代，不过还是比二分快。...实际我目前没有找到比牛顿迭代又好又快的算法了，但是我找到一个相关的故事，以及它引出的以牺牲精度换取速度求\frac{1}{\sqrt{x}}的神奇算法，当然它也可以用来求\sqrt2。...这里说不严格是因为我只做\sqrt2的测试，而且用的是java实现的，而且像是CarmackMethod的实现，可能因为java和c的运行机制的不同，性能会受很大影响，下面这个结果仅供娱乐，看看就好。...上面说了3个解法，那你是不是也很好奇目前各种编程语言库函数里对sqrt是如何实现的？...我也很好奇，于是我们帮你们翻了jdk源码，发现它根本就不需要自己实现sqrt，毕竟sqrt在计算机领域是有个比较常用的计算，所以主流的CPU架构都提供了对sqrt的硬件支持，只需要一条汇编指令就可以了，

1.6K1 0

Interpolator的本质

如果把x轴当做时间，y轴当做距离，可以发现整个过程函数的斜率不变，说明做均速运动。...{ if (mFactor == 1.0f) { return input * input; } else { return (float)Math.pow...三、AccelerateDecelerateInterpolator 3.1 代码注释从注释可以看到AccelerateDecelerateInterpolator属于开始结束慢，但是中间快 /**...float getInterpolation(float input) { return (float)(Math.cos((input + 1) * Math.PI) / 2.0f) + 0.5f...y=x*x*(3*x-2) 4.3 函数曲线我们只要关注0到1的区间，一看图我们就明白了，如果把x当时间，y当距离，就是先从原点往回运动，然后再快速的往终点运行。

4141 0

数学--数论--原根(循环群生成元）

突然今天，我想不起什么是原根来了，查了一下定义，哎~这货不是离散数学，循环群生成元吗？？...我是笨逼枚举将P-1进行质因数分解枚举i,并判断对于每个i是否都有(可以应用快速幂) 第一个符合条件的i就是P的最小原根对于合数 , 只要将 2....int zc=n,all=sqrt(n); for(int i=2;i<=all;i++) { if(n%i!...(int x,const int y,const int mod) { int res=1; for(int i=1;i<=y;i<<=1,x=x*x%mod)if(i&y)res=res*x%mod...zc=n,all=sqrt(n); for(int i=2;i<=all;i++) { if(n%i!

2.2K5 0

PAT乙级题目总结

a : gcd(b, a % b); 3} cin与cout cin 和 cout 比 printf 和 scanf 更加耗时，且不要再同一个程序中同时使用 cout 和 printf。...和float在printf中都是%f 常用math函数 1fabs(double x);//对double类型取绝对值 2floor(double x)；//对double类型向下取整 3ceil(double...x);//对double类型向上取整 4round(double x);//对double类型的值四舍五入 5log(double x);//自然对数为底，若其他为底，则用换底公式 6pow(double...) { 3 for (int i = 2; i <= sqrt(num); i++) { 4 if (num % i == 0) { 5 return false...; 6 } 7 } 8 return true; 9} 快排的特点在快速排序中选择的主元排序后位置是不变的：参考题目1045快速排序 (25 分)。

5341 0

#数值分析读书笔记（4）求非线性方程的数值求解

{ return Math.pow(x,3)+2*Math.pow(x,2)-4; } } 给出最后的输出结果 1.1303954347672787 1.1303954347672787...(x); } } public static double function(double x){ return Math.sqrt...x,2)+4*Math.pow(x,2); } } 比起二分法或者迭代法,它的收敛速度还是较为快速的,特别是当初始值接近根的情况,更加明确的说,Newton切线在充分接近单根的情况下二次收敛,...给出代码的实现 public class NumericalTest { public static void main(String[] args){ double x1=1...public static double function(double x){ return Math.pow(x,3)+2*Math.pow(x,2)-4; } } 割线法的速度也是十分快

1K2 0

CUDA优化冷知识24|函数和指令使用的选择和优化

例如sqrt()函数，有double sqrt(double)的版本的，也有float sqrt(float)的版本的。...我们这里简单的举几个例子就好：计算x的1/6次方，可以先计算一次x的平方根倒数，再计算一次立方根倒数，这样就得到1/6次方的值，而无需使用昂贵的pow之类的函数。...再例如：x的2/3次方，可以先求一个立方根，然后再求一次平方，这样就快速得到了2/3次方。...注意这个快速替换表格里的公式，很多都使用了特殊的GPU上专用的函数，例如rsqrt, rcbrt（二次方和三次方根的倒数），而不是标准的C库(libm)，在CPU上我们能见到的sqrt、cbrt(二次方和三次方根...因为特殊的rsqrtf()这种，可能在实现上具有更好的精度和性能。例如我们之前的章节知道过，SFU这种喜欢提供平方根的倒数的这种快速的接近，可能有助于性能的提升。

8582 0

单片机常用的14个C语言算法

（可用以下程序段实现） void main() { int m,i,k; printf("please input a number:\n"); scanf("%d",&m); k=sqrt(...因为工作的需要，要在单片机上实现开根号的操作。...目前开平方的方法大部分是用牛顿迭代法。我在查了一些资料以后找到了一个比牛顿迭代法更加快速的方法。不敢独享，介绍给大家，希望会有些帮助。...1.原理因为排版的原因，用pow(X,Y)表示X的Y次幂，用B[0]，B[1]，...，B[m-1]表示一个序列，其中[x]为下标。...实现代码这里给出实现32位无符号整数开方得到16位无符号整数的C语言代码。

1.4K4 0

牛顿迭代法(Newtons Method)

f(x)=0中精确解的意义是，当取得解的时候，函数值为零（即f(x)的精确解是函数的零点）。因此，x1比x0更加接近精确的解。只要不断以此方法更新x，就可以取得无限接近的精确的解。...牛顿迭代法是已知的实现求方根最快的方法之一,只需要迭代几次后就能得到相当精确的结果。首先设x的m次方根为a。下面程序使用牛顿法求解平方根。...也比c++标准库的sqrt()函数要快好几倍。此段代码有一个奇怪的句子： i = 0x5f3759df - ( i >> 1 ); // what the fuck? ...以雷神之锤III程序为蓝本可以写出比sqrt()更强大的求平方根函数： 1 int sqrt(float x) { 2 if(x == 0) return 0; 3 float...result = x; 4 float xhalf = 0.5f*result; 5 int i = *(int*)&result; 6 i = 0x5f375a86

1.9K5 0

【RSA解密】蓝桥杯第十届省赛A组扩展欧几里得算法

扩展欧几里得算法的代码如下： int gcd_Ex(int a,int b,int &x,int &y) { //ax+by=gcd(a,b)的整数解 if(b==0) { x=1;...根据题意我们只需要求解：即可，快速幂求模代码如下： ll pow_mod(ll a,ll b,ll mod) { //快速求解a^b%mod ll res=1,base=a%mod; while...然后通过调试发现是最后一步快速幂求模很慢，而pow_mod中主要的运算集中在快速乘求模，于是可以再优化一下： ll fast_mul(ll a, ll b, ll mod){ //快速求解a*b%mod...{ for(ll i=2;i<=sqrt(x);i++) { if(x%i==0) { return false; } } return true; } ll...pow_mod(C,e,n); cout<<x; return 0; } ans：579706994112328949

3881 0

贪心算法求快速平方根倒数算法中的“魔术数字”【含matlab源代码】

一、快速平方根倒数算法简介及实现 1.1 算法简介在计算平方根的倒数时，传统的计算方法是先计算a的平方根sqrt(a)，再计算它的倒数1/sqrt(a)。...而快速平方根倒数算法则将输入的32位浮点数a作为一个整数i，用“魔术数字”0x5f3759df减去i右移一位的值产生近似的估值y，再使用牛顿迭代法迭代一次，就得到了相当精度的计算结果。...; x2 = number * 0.5F; y = number; i = * ( long * ) &y; // evil floating...但通过指针将32位浮点数转化为32位整数的运算（以及其逆运算）很难在matlab中实现，但很容易通过c/c++实现。.../sqrt(as); 再调用FastInvSqrtFloat函数计算出R作为魔术数字时的近似结果es，用es与rs的平均均方误差作为的值。

1.2K3 0

Android控件FlowLikeView实现点赞动画

一、具体实现流程仔细分析整个点赞过程可以发现，首先是“爱心”的出现动画，然后是“爱心”以类似气泡的形式向上运动。...，而是通过一条不规则的曲线往上浮，而我们知道 TypeEveluator 的作用就是根据动画的变化率来设置控件属性的当前值，具体算法实现就是使用三阶贝塞尔曲线公式: ?...= (float) Math.pow(leftTime, 3) * startValue.x + 3 * (float) Math.pow(leftTime, 2) * fraction * ctrlPointF1....x + 3 * leftTime * (float) Math.pow(fraction, 2) * ctrlPointF2.x + (float) Math.pow(fraction...) Math.pow(leftTime, 2) * startValue.x + 2 * fraction * leftTime * ctrlPointF1.x // + ((float) Math.pow

7562 0

Android控件实现直播App点赞飘心动画

一、具体实现流程仔细分析整个点赞过程可以发现，首先是“爱心”的出现动画，然后是“爱心”以类似气泡的形式向上运动。...，而是通过一条不规则的曲线往上浮，而我们知道 TypeEveluator 的作用就是根据动画的变化率来设置控件属性的当前值，具体算法实现就是使用三阶贝塞尔曲线公式: ?...= (float) Math.pow(leftTime, 3) * startValue.x + 3 * (float) Math.pow(leftTime, 2) * fraction * ctrlPointF1....x + 3 * leftTime * (float) Math.pow(fraction, 2) * ctrlPointF2.x + (float) Math.pow(fraction, 3) *...* startValue.x + 2 * fraction * leftTime * ctrlPointF1.x // + ((float) Math.pow(fraction, 2)) * endValue.x

9801 0

使用程序计算近似Π值

但是你有没有想过这个PI是怎么来的，是直接存储吗？还是计算来的。虽然不知道具体是怎么实现的，但是我们可以使用一些简单的数学知识，来计算出近似的Π值。...A的计算主要是矩形面积的累加，假如我们把圆拆成n个矩形，每个矩形的宽都为1/n，那么第i个矩形的面积应该为： dS = dx * y 因为是半圆，因此y的计算公式如下： y = \sqrt{R^2 -...(x-R)^2} 其中x应该为i/n*R（因为是把R分成n份，第i个矩形的x=i/n*R）。...最后，n个矩形相加的公式为： A = \sum_{i=1}^n\frac{\sqrt{R^2 - (\frac{i}{n}R-R)^2}}{n} 下面我们就可以根据公式用程序求出Π的近似值。...= pow(pow(r, 2) - pow(i*r/n-r, 2), 0.5) # 使用公式计算y，其中x=i/n dS = dx * y # 单个小矩形的面积 A += dS # 对矩形面积进行累加

1.7K2 0

WebRTC 音频算法附完整C代码

例如: AGE算法中的WebRtcSpl_Sqrt 快速开平方的实现。...可以采用如下汇编函数替换之： static float fast_sqrt(float x) { float s; #if defined(__x86_64__) __asm__ __volatile...); #else s = sqrtf(x); #endif return s; } 现代很多cpu 汇编指令已经支持开平方的快速实现，经过测试比对确实会比WebRtcSpl_Sqrt ...快不少的。...关于开平方的快速实现，详情可以看下： https://www.codeproject.com/Articles/69941/Best-Square-Root-Method-Algorithm-Function-Precisi

2.7K5 0

BashShell数值运算

简介 Bash Shell 本身一些内置命令可以执行简单的整数运算，但复杂一些的运算（比如浮点数运算）需要通过一些外部命令来实现，Bash Shell 数学运算符只支持整数运算。...其他运算函数运算 bc 命令提供了数学函数库（需指定 -l 选项，该选项默认小数精度为 20 位），包含了一些基本的数学函数（以下三角函数均采用弧度值）：函数命令示例 sin(x) s(x) echo..."l($x)" | bc -l exp(x) e(x) echo "e($x)" | bc -l 开方 sqrt(x) echo "sqrt($x)" | bc -l … … … awk 命令同样提供了一些基本数学函数...'{printf log($1);}' exp(x) exp(x) echo "$i" | awk '{printf exp($1);}' 开方 sqrt(x) echo "$i" | awk '{printf...sqrt($1);}' … … …

3470 0

OpenCV角点检测源代码分析（Harris和ShiTomasi角点）

eigen2x2（）函数如下：2x2矩阵特征值和特征向量的计算，有线性代数基础的都学过，就不再赘述 static void eigen2x2( const float* cov, float* dst,.../std::sqrt(x*x + y*y + DBL_EPSILON); //保存特征值l1及其对应的特征向量 dst[6*j] = (float)l1;.../std::sqrt(x*x + y*y + DBL_EPSILON); //保存特征值l2及其对应的特征向量 dst[6*j + 1] = (float)l2;...half = v_setall_f32(0.5f); for( ; j <= size.width - v_float32x4::nlanes; j += v_float32x4...; float b = cov[j*3+1]; float c = cov[j*3+2]*0.5f; //求根公式计算较小的根，

1.9K6 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云