复杂的Mul和Div使用sse说明 - 腾讯云开发者社区

、、、

通过SSE指令执行复杂的乘法和除法是否有益？我知道加法和减法在使用SSE时表现得更好。有人能告诉我如何使用SSE执行复数乘法以获得更好的性能吗？

浏览 1提问于2010-07-09得票数 11

1回答

Ubuntu -如何判断是否AVX或SSE，当前正在使用的CPU应用程序？

、、、、

我目前运行BOINC跨多个具有GPU的服务器。因此，我是否可以运行任何命令，并以某种方式查看当前运行的</

浏览 36提问于2020-02-20得票数 0

回答已采纳

1回答

_mm_mul_epu32对_mm_mul_epi32

、、

为了开始讨论，_mm_mul_epu32和_mm_mul_epi32之间的基本区别是：我不明白的是在什么情况下应该使用_mm_mul_epu32？似乎没有像_mm_set

浏览 8提问于2013-10-24得票数 2

回答已采纳

1回答

SSE工作在元素数不是4的倍数的数组上。

、、、、

c[i] = a[i] * b[i], i = 0, 1, ..., 6__m128* sse_a = (__m128*) &a[0];__m128* sse_c = (__m128*) &c[0]; C中的</

浏览 4提问于2016-09-08得票数 0

回答已采纳

1回答

我想加速我的算法，它是一个目标函数f(x)。问题的维度是5000。我已经在代码中引入了很多改进，但计算时间仍然不符合我的期望。在存在“长”循环的目标函数中，我成功地应用了_mm_mul_ps，_mm_rcp_ps，_mm_store_ps .、__m128Var、变量等。但是有一部分代码很难矢量化.我附加了最有问题的代码(最慢的计算)，在这里我仍然无法进行改进(提醒您，这是从更大的计算中获得的代码的一部分，但是我<e

浏览 0提问于2019-09-16得票数 0

回答已采纳

1回答

使用AVX后SSE运行缓慢

、、、、

我一直在处理的一些SSE2和AVX代码有一个奇怪的问题。我正在构建我的应用程序GCC，运行时cpu的特征检测。对象文件是为每个CPU特性使用独立标志构建的，例如：当我第一次启动程序时，我发现SSE2例程和

浏览 5提问于2015-10-15得票数 11

回答已采纳

1回答

手臂霓虹灯上的_mm_mul_epu32和_mm_mullo_epi32

、、、、

我正在开发一个将SSE代码移植到Neon的应用程序。我们有类似的霓虹灯吗？

浏览 4提问于2022-04-01得票数 0

2回答

当它应该被包围的时候，SSE就会停下来

、、、、

我正在开发一个应用程序，该应用程序将浮动示例在-1.0到1.0之间转换为签名16位，以确保优化( SSE )例程的输出是准确的，我已经编写了一组测试，它针对SSE版本运行非优化版本并比较它们的输出。在开始之前，我已经确认SSE舍入模式设置为最近。输入的失败。下面是正在使用的SSE代码： void Float_S16(const float *in, int16_t *out, const unsigned int s

浏览 5提问于2015-10-14得票数 9

回答已采纳

1回答

使用SSE内部函数的寄存器不足

、、、

在这篇文章中，我问到了显式寄存器-内存事务和中间指针之间的区别。在实践中，中间指针表现出稍高的性能，然而，在硬件方面，什么是中间指针还不清楚？如果创建了指针，是否意味着一些寄存器也被占用，或者寄存器的调用在某些SSE操作期间发生(例如，_mm_mul)？[i] = _mm_mul(inp1_sse[i], inp2_sse[i]); float *input2; fl

浏览 0提问于2013-07-17得票数 0

回答已采纳

1回答

在没有SSE4的情况下，在VC++中向量化乘法是可能的吗？

、、

我尝试使用_mm_mul_epi32，但是我的CPU只支持"MMX，SSE (1,2,3,3S)，EM64T“指令。有没有人能告诉我能不能试一下别的功能？

浏览 1提问于2011-03-28得票数 4

1回答

通过编写程序来计算一个方程来比较多个地址机？

、

通过编写计算程序来计算零、一、二和三台地址机：对于这四台机器中的每一台，可用的使用说明如下：PUSH ADDDIVSUB LOAD MUL SUB MOVE (X, Y) DIV (X, Y) SUB (X

浏览 2提问于2013-11-18得票数 0

1回答

SSE2:在GCC 4.2和O0优化的情况下，_mm_mul_ps在OS上失败

、、、

我试图用SSE2计算两个4d浮动矢量之间的平方欧几里德距离。我的操作系统是MacOSX10.7Lion。 __m128 sse</em

浏览 4提问于2012-12-24得票数 3

回答已采纳

2回答

SSE2倍乘比标准乘法慢

、、、

我想知道为什么下面的带有SSE2指令的代码执行乘法的速度比标准的C++实现慢。(pData[i], pWin[i]);pOut[i] = _mm_mul_pd(pData[i], pWin[i]);tmp = _mm_mul_pd(pData[i], pWin[i]); 在__m128d我在发布

浏览 1提问于2011-07-03得票数 0

回答已采纳

2回答

4个32位整数的SSE乘法

、、、、

我没有找到任何可以做到这一点的指令。

浏览 1提问于2012-05-08得票数 18

回答已采纳

2回答

使用内部函数时出现未处理的异常

、、

我有一个使用VC++创建的应用程序，我想通过向量化一些操作来探索优化机会。首先，我尝试使用以下代码：p1.m128i_u32[1] = 2;p1.m128i_u32m128i_u32[0] = 1;p2.m128i_u32[2] = 3;但是，当执行_

浏览 1提问于2011-03-28得票数 3

回答已采纳

2回答

Python浮点无声溢出精度错误

、、、、

from operator import add, sub, mul, div inputs = dict(zip(arglabels, d[0][: -4] + (d[0][-3]*d[0][-4],))) inputs.update(other因此，它一定是一个精确的错误，使结果完全

浏览 4提问于2015-10-27得票数 4

回答已采纳

1回答

如何使用_mm_mul_ps指定对齐方式

、、、、

我使用带有一个参数的SSE内部函数作为内存位置(_mm_mul_ps(xmm1,mem))。我怀疑哪一个会更快：或者：xmm1 =_mm_mul_ps(xmm1,xmm0); 有没有一种方法可以用_mm_mul_ps()内部指定对齐？

浏览 4提问于2015-07-09得票数 2

1回答

基于SSE的复向量标度

、、、、

我想将SSE指令应用于包含复数的向量。没有SSE指令，我可以用下面的代码来完成它。但是，当我应用SSE指令时，我不知道如何将计算出的实部和虚部返回到数组中。我怎么才能解决这个问题？int i=0; i<length; i+=2) { real = _mm_mul_pd(real, multiplier); imag = _mm_set

浏览 4提问于2016-05-04得票数 0

回答已采纳

3回答

在32位系统上使用int64_t而不是int32_t对性能有什么影响？

、、、、

我们的C++库目前使用time_t存储时间值。在某些地方，我开始需要亚秒级的精度，所以无论如何都需要一个更大的数据类型。另外，在一些地方，绕过年份-2038的问题也是很有用的。编译器将生成使用32位寄存器执行64位算术的代码.但如果速度太慢，我可能不得不使用一种更有区别的方法来处理时间值，这可能会使软件更难以维护。哪些因素影响这些操作的性能？可能是编译器和编译

浏览 6提问于2013-05-30得票数 53

回答已采纳

5回答

环的SSE* SIMD优化*

、、

我在循环中有一些代码{}更新我学会了矢量化(如果你使用本质，那就不那么难了)，并在SSE中实现了我的循环。但是，当在SSE2编译器中设置VC++标志时，我获得了与我自己的<

浏览 3提问于2010-05-27得票数 6

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用sse指令的复杂Mul和Div

Ubuntu -如何判断是否AVX或SSE，当前正在使用的CPU应用程序？

_mm_mul_epu32对_mm_mul_epi32

SSE工作在元素数不是4的倍数的数组上。

C++中一个复杂问题的手工矢量化/SSE

使用AVX后SSE运行缓慢

手臂霓虹灯上的_mm_mul_epu32和_mm_mullo_epi32

当它应该被包围的时候，SSE就会停下来

使用SSE内部函数的寄存器不足

在没有SSE4的情况下，在VC++中向量化乘法是可能的吗？

通过编写程序来计算一个方程来比较多个地址机？

SSE2:在GCC 4.2和O0优化的情况下，_mm_mul_ps在OS上失败

SSE2倍乘比标准乘法慢

4个32位整数的SSE乘法

使用内部函数时出现未处理的异常

Python浮点无声溢出精度错误

如何使用_mm_mul_ps指定对齐方式

基于SSE的复向量标度

在32位系统上使用int64_t而不是int32_t对性能有什么影响？

环的SSE* SIMD优化*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐