腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
利用
循环
携带
依赖
简化
循环
有没有办法
简化
下面的解释器
循环
?
浏览 16
提问于2020-06-29
得票数 1
回答已采纳
1
回答
循环
携带
的类
依赖
、
如何重写我的代码来打破
循环
依赖
?
浏览 0
提问于2014-03-05
得票数 0
1
回答
循环
优化注册重命名如何打破
依赖
关系?什么是执行端口容量?
、
、
、
、
代码是:(我
简化
了一点) vmulpd ymm1, ymm2, [rsi+rax] vmovupd [rdi+rax], ymm1 jl L1 作者说没有
循环
携带
的
依赖
关系。(我跳过了add rax, 32 (它确实是
循环
携带
的,但只有一个
循环
))。但是,毕竟,下一次迭代不能在上一次迭代尚未完成之前修改ym
浏览 1
提问于2016-05-08
得票数 2
回答已采纳
1
回答
循环
携带
的
依赖
性。检测
xmm1 addsd xmm0, xmm3 cmp eax, 1024对于我的眼睛
循环
-
携带
依赖
:mulsd xmm1, xmm2所以我们有三个
循环
携带
的
依赖
。但是,我不知道为什么mulsd xmm3, xmm1不
依赖
。为什么?xmm3实际上不是一个问题(注册重命名),但是,毕竟,这个指令必须等
浏览 0
提问于2016-05-19
得票数 0
回答已采纳
2
回答
并行编程
依赖
开放访问
、
、
我正在尝试并行化这个
循环
,但是在PGI编译器中遇到了一些错误,我不明白出了什么问题{ forw)+Ms[i+1].x*w; }} 错误85,生成多核代码87,#杂注acc
循环
组89,加速器限制:大小的GPU副本的Y,X是未知的复杂
循环
携带
依赖
的Ms->t,Ms->x,
浏览 2
提问于2018-04-06
得票数 1
1
回答
循环
携带
的
依赖
项在哪里,如果存在的话?
、
、
我被告知要寻找一个
携带
依赖
的
循环
,但我仍然不清楚它的定义和如何找到它。如果有人能给我提示或提示的话。我只需要被指引到正确的方向。
浏览 0
提问于2015-10-27
得票数 0
2
回答
为什么MOVNTI不慢一些,在
循环
中重复存储到相同的地址?
、
、
有
循环
携带
依赖
吗?毕竟,仍然没有
循环
携带
依赖
关系。
浏览 2
提问于2016-05-08
得票数 3
回答已采纳
1
回答
OpenACC中的操作符重载问题
、
、
0; k < N; k++ ) } }//编译器错误: 238,生成隐式复制(P1) 244,复
循环
携带
依赖
于防止并行化加速器标量内核生成生成Tesla代码244,#实用化acc
循环
seq 247,#实用化acc
循环
seq 250,#Tesla acc
循环
seq 247,复
循环
携带
依赖
于防止并行化250,复
浏览 0
提问于2018-02-16
得票数 0
回答已采纳
2
回答
循环
携带
的
依赖
项在哪里?
、
、
、
、
有人看到下面的
循环
代码有什么明显的地方吗?我没有看到为什么as 2012的C++编译器不能自动向量化
循环
代码?原因1200在MSDN中记录为:
循环
包含
循环
携带
的数据
依赖
项,以防止矢量化。
循环
的不同迭代相互干扰,从而使
循环
矢量化会产生错误的答案,而自动向量器无法向自己证明不存在这种数据
依赖
。我知道(或者我很确定)没有任何
循环
携带
的数据
依赖
项,但我不确定是什么阻止了编译器实现这一点
浏览 1
提问于2012-12-23
得票数 12
回答已采纳
1
回答
必须按顺序发生的操作的处理器的延迟界和吞吐量界
、
、
教科书的问题5.5和5.6介绍了这两种可能用于多项式计算的
循环
结构。degree];for (int i = degree - 1; i >= 0; i--) {}似乎在将ai添加到此产品以产生下一个结果值之前,a
浏览 1
提问于2020-07-26
得票数 1
回答已采纳
1
回答
存在数据
依赖
时的CUDA正确性
、
、
我想知道如何根据数据
依赖
性编写cuda程序。N s2: x[i]=a[i] + c; //X[] is N-sized array 从s1到s2有数据
依赖
关系,如何编写CuDA代码来向量化这个
循环
呢?
浏览 2
提问于2014-04-10
得票数 0
1
回答
C++自矢量化矩阵乘法环
、
、
、
due to reason '1200'我阅读了MSDN提供的资源,其中指出: 原因代码1200:
循环
包含
循环
携带
的数据
依赖
,以防止矢量化.
循环
的不同迭代相互干扰,从而使
循环
矢量化会产生错误的答案,而自动向量器无法向自己证明不存在这种数据
依赖
。原因代码1000:编译器检测到
循环
主体中的数据
依赖
项
浏览 2
提问于2015-11-27
得票数 1
1
回答
为什么GCC和Clang不使用cvtss2sd [内存]?
、
、
、
我试图优化一些代码,这些代码应该从内存中读取单个精度的浮点数,并对它们执行双精度运算。这正在成为一个重要的性能瓶颈,因为将数据作为单精度存储在内存中的代码实质上是慢,而等效代码将数据存储在内存中作为双精度存储。下面是一个捕捉我问题本质的玩具C++程序:__attributes__ ((noinline)) float* GetFloat() { *f = 3
浏览 1
提问于2013-05-16
得票数 11
回答已采纳
3
回答
函数指针的分支预测
、
、
我有一个
循环
,一遍又一遍地运行。该
循环
中的逻辑取决于程序所处的模式。
循环
将保持相同的模式在许多周期(数是未知的前期,但数千)。该程序只运行在英特尔x64机器上,不需要
携带
。我希望CPU能够
利用
分支预测,但是因为我的分支不是有条件的(在程序集级别上),但是分支的位置确实取决于变量,(functionPtr+mode)。
浏览 1
提问于2014-10-07
得票数 6
回答已采纳
1
回答
为什么VisualC++自动矢量器不将这个简单的
循环
矢量化?
、
、
、
、
我不明白为什么VisualC++不能自动矢量化这个
循环
.有什么想法吗?我得到:其中,原因代码1200是: 但是为什么呢?
浏览 1
提问于2013-12-22
得票数 7
回答已采纳
1
回答
利用
Matlab并行化
简化
嵌套for
循环
、
、
我需要帮助
简化
这个嵌套的parfor和
循环
,其中var、mats和array是:Y是5000 x 147矩阵,numProperties是5000 x 4矩阵,PaymentTable是5000阵列,boolFlag
浏览 0
提问于2013-12-13
得票数 0
2
回答
在ASP.NET MVC4解决方案中使用编译时配置的
依赖
注入进行
依赖
反转
、
、
、
、
我一直在研究如何设计一个MVC4Web解决方案,它遵循
依赖
反转原则,并
利用
依赖
注入(DI)容器,该容器配置流畅(即具有编译时类型检查)。我发现自己倾向于结果分层方法(用红色箭头显示的
依赖
关系): 为了避免
循环
引用,CompositionRoot被移到它
浏览 2
提问于2013-05-24
得票数 3
1
回答
OpenMP:
循环
继承
依赖
项
、
、
我试图在C++中实现一个简单的累积和代码,如下所示:for (k=1;k<100; k++)在这个上,记录了一个实现,以消除
循环
结转
依赖
m=0;m<2;m++) { x[k] = x[k-1] + x[k]; } 问题是,我仍然看到
循环
在这里
携带
依赖
项消除这种
依赖
的最佳方法是什么?
浏览 3
提问于2016-11-13
得票数 0
回答已采纳
1
回答
与openmp并行化的嵌套c++ for
循环
、
、
是否有可能只并行化内部
循环
?当我运行它时,它给出了错误的结果。 谢谢
浏览 0
提问于2015-12-05
得票数 1
1
回答
依赖
链分析
、
、
、
、
来自的12.7节:一个
循环
示例。讨论示例代码的段落之一是:
循环
中有一个
依赖
链。这是停用时间的三倍,但它不是
循环
携带
的
依赖
,因为每个迭代的结果被保存到内存中,而不是在下一个迭代中重用。无序执行机制和流水线使得每个计算都可以在前面的计算完成之前开始。唯一的
循环
携带
依赖
链是add eax,16,它的延迟仅为1。 ## Example 12.6b. DAX
浏览 5
提问于2016-04-20
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券