腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
使用
sse
指令
的
复杂
Mul
和
Div
、
、
、
通过
SSE
指令执行
复杂
的
乘法
和
除法是否有益?我知道加法
和
减法在
使用
SSE
时表现得更好。有人能告诉我如何
使用
SSE
执行复数乘法以获得更好
的
性能吗?
浏览 1
提问于2010-07-09
得票数 11
1
回答
Ubuntu -如何判断是否AVX或
SSE
,当前正在
使用
的
CPU应用程序?
、
、
、
、
我目前运行BOINC跨多个具有GPU
的
服务器。因此,我是否可以运行任何命令,并以某种方式查看当前运行
的</
浏览 36
提问于2020-02-20
得票数 0
回答已采纳
1
回答
_mm_
mul
_epu32对_mm_
mul
_epi32
、
、
为了开始讨论,_mm_
mul
_epu32
和
_mm_
mul
_epi32之间
的
基本区别是: 我不明白
的
是在什么情况下应该
使用
_mm_
mul
_epu32?似乎没有像_mm_set
浏览 8
提问于2013-10-24
得票数 2
回答已采纳
1
回答
SSE
工作在元素数不是4
的
倍数
的
数组上。
、
、
、
、
c[i] = a[i] * b[i], i = 0, 1, ..., 6__m128*
sse
_a = (__m128*) &a[0];__m128*
sse
_c = (__m128*) &c[0]; C中
的</
浏览 4
提问于2016-09-08
得票数 0
回答已采纳
1
回答
C++中一个
复杂
问题
的
手工矢量化/
SSE
、
、
、
、
我想加速我
的
算法,它是一个目标函数f(x)。问题
的
维度是5000。我已经在代码中引入了很多改进,但计算时间仍然不符合我
的
期望。在存在“长”循环
的
目标函数中,我成功地应用了_mm_
mul
_ps,_mm_rcp_ps,_mm_store_ps .、__m128Var、变量等。但是有一部分代码很难矢量化.我附加了最有问题
的
代码(最慢
的
计算),在这里我仍然无法进行改进(提醒您,这是从更大
的
计算中获得
的
代码
的
一部分,但是我<e
浏览 0
提问于2019-09-16
得票数 0
回答已采纳
1
回答
使用
AVX后
SSE
运行缓慢
、
、
、
、
我一直在处理
的
一些
SSE
2
和
AVX代码有一个奇怪
的
问题。我正在构建我
的
应用程序GCC,运行时cpu
的
特征检测。对象文件是为每个CPU特性
使用
独立标志构建
的
,例如:当我第一次启动程序时,我发现
SSE
2例程
和
浏览 5
提问于2015-10-15
得票数 11
回答已采纳
1
回答
手臂霓虹灯上
的
_mm_
mul
_epu32
和
_mm_mullo_epi32
、
、
、
、
我正在开发一个将
SSE
代码移植到Neon
的
应用程序。我们有类似的霓虹灯吗?
浏览 4
提问于2022-04-01
得票数 0
2
回答
当它应该被包围
的
时候,
SSE
就会停下来
、
、
、
、
我正在开发一个应用程序,该应用程序将浮动示例在-1.0到1.0之间转换为签名16位,以确保优化(
SSE
)例程
的
输出是准确
的
,我已经编写了一组测试,它针对
SSE
版本运行非优化版本并比较它们
的
输出。在开始之前,我已经确认
SSE
舍入模式设置为最近。输入
的
失败。下面是正在
使用
的
SSE
代码: void Float_S16(const float *in, int16_t *out, const unsigned int s
浏览 5
提问于2015-10-14
得票数 9
回答已采纳
1
回答
使用
SSE
内部函数
的
寄存器不足
、
、
、
在这篇文章中,我问到了显式寄存器-内存事务
和
中间指针之间
的
区别。在实践中,中间指针表现出稍高
的
性能,然而,在硬件方面,什么是中间指针还不清楚?如果创建了指针,是否意味着一些寄存器也被占用,或者寄存器
的
调用在某些
SSE
操作期间发生(例如,_mm_
mul
)?[i] = _mm_
mul
(inp1_
sse
[i], inp2_
sse
[i]); float *input2; fl
浏览 0
提问于2013-07-17
得票数 0
回答已采纳
1
回答
在没有
SSE
4
的
情况下,在VC++中向量化乘法是可能
的
吗?
、
、
我尝试
使用
_mm_
mul
_epi32,但是我
的
CPU只支持"MMX,
SSE
(1,2,3,3S),EM64T“指令。 有没有人能告诉我能不能试一下别的功能?
浏览 1
提问于2011-03-28
得票数 4
1
回答
通过编写程序来计算一个方程来比较多个地址机?
、
通过编写计算程序来计算零、一、二
和
三台地址机:对于这四台机器中
的
每一台,可用
的
使用
说明
如下:PUSH ADD
DIV
SUB LOAD
MUL
SUB MOVE (X, Y)
DIV
(X, Y) SUB (X
浏览 2
提问于2013-11-18
得票数 0
1
回答
SSE
2:在GCC 4.2
和
O0优化
的
情况下,_mm_
mul
_ps在OS上失败
、
、
、
我试图用
SSE
2计算两个4d浮动矢量之间
的
平方欧几里德距离。我
的
操作系统是MacOSX10.7Lion。 __m128
sse</em
浏览 4
提问于2012-12-24
得票数 3
回答已采纳
2
回答
SSE
2倍乘比标准乘法慢
、
、
、
我想知道为什么下面的带有
SSE
2指令
的
代码执行乘法
的
速度比标准
的
C++实现慢。(pData[i], pWin[i]);pOut[i] = _mm_
mul
_pd(pData[i], pWin[i]);tmp = _mm_
mul
_pd(pData[i], pWin[i]); 在__m128d我在发布
浏览 1
提问于2011-07-03
得票数 0
回答已采纳
2
回答
4个32位整数
的
SSE
乘法
、
、
、
、
我没有找到任何可以做到这一点
的
指令。
浏览 1
提问于2012-05-08
得票数 18
回答已采纳
2
回答
使用
内部函数时出现未处理
的
异常
、
、
我有一个
使用
VC++创建
的
应用程序,我想通过向量化一些操作来探索优化机会。首先,我尝试
使用
以下代码:p1.m128i_u32[1] = 2;p1.m128i_u32m128i_u32[0] = 1;p2.m128i_u32[2] = 3;但是,当执行_
浏览 1
提问于2011-03-28
得票数 3
回答已采纳
2
回答
Python浮点无声溢出精度错误
、
、
、
、
from operator import add, sub,
mul
,
div
inputs = dict(zip(arglabels, d[0][: -4] + (d[0][-3]*d[0][-4],))) inputs.update(other因此,它一定是一个精确
的
错误,使结果完全
浏览 4
提问于2015-10-27
得票数 4
回答已采纳
1
回答
如何
使用
_mm_
mul
_ps指定对齐方式
、
、
、
、
我
使用
带有一个参数
的
SSE
内部函数作为内存位置(_mm_
mul
_ps(xmm1,mem))。我怀疑哪一个会更快:或者:xmm1 =_mm_
mul
_ps(xmm1,xmm0); 有没有一种方法可以用_mm_
mul
_ps()内部指定对齐?
浏览 4
提问于2015-07-09
得票数 2
1
回答
基于
SSE
的
复向量标度
、
、
、
、
我想将
SSE
指令应用于包含复数
的
向量。没有
SSE
指令,我可以用下面的代码来完成它。但是,当我应用
SSE
指令时,我不知道如何将计算出
的
实部
和
虚部返回到数组中。我怎么才能解决这个问题?int i=0; i<length; i+=2) { real = _mm_
mul
_pd(real, multiplier); imag = _mm_set
浏览 4
提问于2016-05-04
得票数 0
回答已采纳
3
回答
在32位系统上
使用
int64_t而不是int32_t对性能有什么影响?
、
、
、
、
我们
的
C++库目前
使用
time_t存储时间值。在某些地方,我开始需要亚秒级
的
精度,所以无论如何都需要一个更大
的
数据类型。另外,在一些地方,绕过年份-2038
的
问题也是很有用
的
。编译器将生成
使用
32位寄存器执行64位算术
的
代码.但如果速度太慢,我可能不得不
使用
一种更有区别的方法来处理时间值,这可能会使软件更难以维护。 哪些因素影响这些操作
的
性能?可能是编译器
和
编译
浏览 6
提问于2013-05-30
得票数 53
回答已采纳
5
回答
环
的
SSE
SIMD优化
、
、
我在循环中有一些代码{}更新 我学会了矢量化(如果你
使用
本质,那就不那么难了),并在
SSE
中实现了我
的
循环。但是,当在
SSE
2编译器中设置VC++标志时,我获得了与我自己
的
<
浏览 3
提问于2010-05-27
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Qt学习笔记 TableWidget使用说明和增删改操作的实现
【校园通知】关于ScienceDirect和EI数据库暂时无法正常使用的说明
关于小说搜文小程序:已经做好了的通知和使用说明
python实现加减乘除计算器
关于ScienceDirect和EI数据库恢复访问以及部分IP限制使用的说明
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券