腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
0
回答
Openmp
中
的
缩减
在
我
的
代码
中
使用
相同
数量
的
线程
返回
不同
的
结果
、
我
使用
“return”
的
openmp
代码
在
一次又一次运行时
返回
的
结果
不一样。案例1:
使用
"reduction“omp_set_num_threads(4);for(ii =事实上,func(ii)
使用
了另一个calcul()函数,这可能会导致并行执行
中
的</e
浏览 8
提问于2016-06-30
得票数 1
回答已采纳
2
回答
用于
在
C++
中
减少复杂变量
的
OpenMP
的
优雅(和典型)解决方案?
、
我
意识到reduction只适用于C++
中
的
POD类型。您将如何实现复杂类型累加器
的
缩减
?0.0,0.0), y(1.0,1.0);for(int i=0; i<5; i++) x += y;(请注意,
我
可能省略了一些语法似乎一个显而易见
的
解决方案是将实部和虚部分成临时
的
两倍,然后在这些部分上累加。
我
想我是
在
寻找
浏览 0
提问于2011-08-23
得票数 16
回答已采纳
2
回答
为什么这个
OpenMP
程序每次都给我
不同
的
答案?
、
、
、
我
试着让这个程序用多个
线程
运行。
在
for循环之后还有#pragma omp ordered,
我
认为这实际上并不需要,因为在所有
线程
都完成了for循环之前,不应该继续执行任何
线程
。这是正确
的
吗?这也是为什么与作为单个
线程
程序运行相比,
我
的
性能只得到第二次提高
的
原因吗?对
我
来说是6秒而不是7秒。
我
不能回答
的
是,为什么这个程序每次运行它时都给我<em
浏览 2
提问于2015-10-18
得票数 3
回答已采纳
3
回答
顺序和并行版本给出了
不同
的
结果
--为什么?
、
、
、
我
有一个嵌套循环:(L和A是完全定义
的
输入) reduction(+:dummyL[i][k] = (A[i][k] - dummy)/L[k][k]; dummy = 0;它们都给出了
不同
的
结果
可能导致问题
的
原因是什么?编辑: 为了摆脱atomic指令引起
的
问题,<e
浏览 0
提问于2012-04-07
得票数 2
回答已采纳
1
回答
OpenMP
和MKL
线程
、
、
我
有一个用Fortran编写
的
代码
,它
使用
MKL
的
DGESVD,
使用
英特尔编译器
在
8个内核上运行。
代码
是通过
OpenMP
加速
的
。
我
还知道
OpenMP
和MKL有自己
的
设置来设置
线程
的
数量
(omp_num_threads和mkl_num_threads)。
我
想知道
线程
的<
浏览 1
提问于2012-12-09
得票数 8
回答已采纳
1
回答
并行约简
的
浮点相关数值稳定性问题
、
、
我
一直
在
寻找一些与浮动求和相关
的
在线资源和相关
的
准确性问题。例如: 大多数人建议
在
处理任何现代硬件
的
浮点求和时,
使用
某种形式
的
手动干预。例如(1)
使用
Kahan
的
浮点求和算法,或(2)排序和和更接近
的
幅度数,等等。这些细微差别是由MPI_AllReduce或
OpenMP
约简核处理
的
吗?
浏览 0
提问于2019-09-26
得票数 0
回答已采纳
2
回答
为什么静态计划循环
的
OpenMP
还原条款是不确定
的
?
、
、
我
一直
在
致力于一个多GPU项目,在那里,
我
有问题,以获得不确定
的
结果
。
我
惊讶地发现,由于
在
CPU上执行了一个约简子句,
我
获得了不确定
的
结果
。
在
“
使用
OpenMP
”一书中-下一步是这样写
的
也许<
浏览 6
提问于2022-02-15
得票数 2
1
回答
将
OpenMP
缩减
为C++模板数组指定
的
大小会导致未定义
的
行为。
、
我
对
OpenMP
还不熟悉,但我正试图
使用
它来加速对具有大量行和少量列
的
2D数组条目的一些操作。同时,
我
使用
约简来计算每列中所有数组值
的
总和。这种情况很少发生,以至于我
在
隔离bug时遇到了很多困难,但我现在想知道这是否是因为
我
在
OpenMP
还原中
使用
了这个
OpenMP
模板参数。
我
注意到,询问如何在
缩减
中
使用
模板类
浏览 2
提问于2018-04-23
得票数 3
回答已采纳
6
回答
并行化:pthread还是
OpenMP
?
、
、
、
在
科学计算领域,当涉及到共享内存并行化时,大多数人
使用
OpenMP
作为准标准。 有没有什么理由(除了可读性之外)
在
pthread上
使用
OpenMP
?后者似乎更基础,
我
怀疑它可以更快、更容易优化。
浏览 0
提问于2009-06-01
得票数 44
回答已采纳
2
回答
运算符"-“
的
Openmp
缩减
、
a) a = omp_get_thread_num()+1; std::cout << "Output:" << a;}
我
使用
openmp
缩减
得到了错误
的
输出...对于下面的
代码
,reduction(+)给出threadnum()
的
sum输出,但是当我提到reduction (-)时,它给出
相同
的
输出...对于&
浏览 0
提问于2013-05-15
得票数 3
回答已采纳
2
回答
OpenMP
降低速度较慢
有两个版本
的
openmp
代码
,有精简
的
和不精简
的
。sum) x = (i-0.5)*step; } partial_sum += + 4.0/(1.0+x*x);#pragma omp critical sum += partial
浏览 4
提问于2013-12-06
得票数 2
3
回答
没有
线程
本地副本
的
OpenMP
减少数组
、
、
我
希望
OpenMP
将一个大数组简化为一个较小
的
动态数组。small[] = {3, 6, 9};overflowlarge 必须支持
OpenMP
3.1 (因此不能像那样
使用
OpenMP
4.5
的
数组
缩减
)small
的
每个元素都从
相同
数量
的
large元素
中
减少(另
浏览 3
提问于2021-06-28
得票数 0
回答已采纳
1
回答
使用
OpenMP
查找所有大数除数
的
正确方法
、
在
我
上大学
的
课堂上,
我
需要在C++
中
创建一个程序,该程序可以找到所有的大
数量
的
除数。
我
需要用几种方法来做。其中之一是
使用
OpenMP
。到目前为止
我
有这样
的
想法: stack<unsigned long long> numbers; #numbers.empty() ){
浏览 3
提问于2021-07-07
得票数 1
回答已采纳
1
回答
Openmp
:如何从
不同
的
线程
收集数组?
、
、
、
、
我
是一个
OpenMP
新手,
我
被一个问题困住了!
我
有一个
在
循环中求和
的
数组,但我
在
并行化它时遇到了问题。你能建议一下怎么做吗?主循环绘制如下: END SUBROUTINE messy_subroutine_that_sums_A
我
的
问题是,
我
从所有
线程
收集A
的
所有尝试都失败了。如果您注意到,
浏览 2
提问于2015-08-13
得票数 0
1
回答
如何为每个
线程
OpenMP
收集数据
、
我
对
OpenMP
并不熟悉,并试图解决从
线程
中
收集数据
的
问题。本文研究了
OpenMP
在
蒙特卡罗方法(正方形内刻圆)上
的
应用实例。
我
理解了以下
代码
的
工作原理:#pragma omp parallel for num_threads(threadNum) shared(threadNum但主要
的
问题是如何将信息直接收集到数组或向量<
浏览 7
提问于2020-04-20
得票数 0
1
回答
如何在python图形工具
中
检查
OpenMP
使用
情况
、
、
、
我
正在
使用
算法
的
python graph-tool,以便在一个大图中找到最小割线。
我
的
算法需要多次调用这个函数,这似乎是瓶颈。因此,
我
想确保它是否像
使用
OpenMP
一样高效地运行。但是,
在
使用
openmp
_set_num_threads(n)更改
线程
数量
时,对于
不同
数量
的
线程
,
我</e
浏览 0
提问于2018-07-29
得票数 1
3
回答
openmp
reduce技术
、
、
、
、
我
有这个for循环,它可以找到最小和最大长度,正如你可以看到
的
,
我
这里有两个值要减少,而在查看
OpenMP
时,
我
只能注意到它只为一个值提供了减少技术。m_patterns[i].size() > m_lmax) }// end for loop
我
可以做以下事情吗#pragma omp parallel for reduction (min:m_lmin,ma
浏览 0
提问于2012-04-13
得票数 4
回答已采纳
2
回答
当MATLAB mex文件完成并将数据传回C++时,是否会产生开销?
、
我
已经用C++写了一个mex文件来提高MATLAB
中
慢“for循环”
的
速度。
我
已经写了两个版本,一个没有
openMP
,一个有。所获得
的
收益非常好,但是
在
测试计时时,
我
注意到,由于多
线程
,一个意外
的
结果
:当mex文件传递回MATLAB时出现时间延迟。每个mex文件完成后,随着下一次计算
的
进行,时间将显示
在
MATLAB命令窗口中。此外,当多
线程
mex
浏览 0
提问于2011-09-18
得票数 1
1
回答
Eigen3矩阵乘法性能取决于处理器?
、
、
、
、
在过去
的
几个月里,
我
一直
在
使用
计算机矩阵乘法技术,并
使用
openMP
和eigen3进行了一些测试。GBvoid matrix4
openmp
(void) int j; for (j=0*序列算法与OMP
不同
,它是m乘法
的
最简单
的
版本,可以在这里看到:。 *启动eige
浏览 4
提问于2012-12-10
得票数 1
回答已采纳
1
回答
OpenMP
和CPU亲和性
、
、
、
sched_setaffinity或pthread_attr_setaffinity_np可以
在
OpenMP
下设置
线程
亲和性吗? 相关:
浏览 3
提问于2011-11-30
得票数 10
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python yield在函数中起返回值中的使用
使用vim在文件中插入命令执行的输出结果
在爬虫中为何 finditer 方法不返回括号内结果的解析及处理方法
ServiceAccount Token 在不同 K8s 版本中的使用
使用 Python 在 JMeter 中实现循环获取返回值的高效性能测试
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券