Openmp中的缩减在我的代码中使用相同数量的线程返回不同的结果

、

我使用“return”的openmp代码在一次又一次运行时返回的结果不一样。案例1:使用"reduction“omp_set_num_threads(4);for(ii =事实上，func(ii)使用了另一个calcul()函数，这可能会导致并行执行中的</e

浏览 8提问于2016-06-30得票数 1

回答已采纳

2回答

用于在C++中减少复杂变量的OpenMP的优雅(和典型)解决方案？

、

我意识到reduction只适用于C++中的POD类型。您将如何实现复杂类型累加器的缩减？0.0,0.0), y(1.0,1.0);for(int i=0; i<5; i++) x += y;(请注意，我可能省略了一些语法似乎一个显而易见的解决方案是将实部和虚部分成临时的两倍，然后在这些部分上累加。我想我是在寻找

浏览 0提问于2011-08-23得票数 16

回答已采纳

2回答

为什么这个OpenMP程序每次都给我不同的答案？

、、、

我试着让这个程序用多个线程运行。在for循环之后还有#pragma omp ordered，我认为这实际上并不需要，因为在所有线程都完成了for循环之前，不应该继续执行任何线程。这是正确的吗？这也是为什么与作为单个线程程序运行相比，我的性能只得到第二次提高的原因吗？对我来说是6秒而不是7秒。我不能回答的是，为什么这个程序每次运行它时都给我<em

浏览 2提问于2015-10-18得票数 3

回答已采纳

3回答

顺序和并行版本给出了不同的结果--为什么？

、、、

我有一个嵌套循环：(L和A是完全定义的输入) reduction(+:dummyL[i][k] = (A[i][k] - dummy)/L[k][k]; dummy = 0;它们都给出了不同的结果可能导致问题的原因是什么？编辑：为了摆脱atomic指令引起的问题，<e

浏览 0提问于2012-04-07得票数 2

回答已采纳

1回答

OpenMP和MKL线程

、、

我有一个用Fortran编写的代码，它使用MKL的DGESVD，使用英特尔编译器在8个内核上运行。代码是通过OpenMP加速的。我还知道OpenMP和MKL有自己的设置来设置线程的数量(omp_num_threads和mkl_num_threads)。我想知道线程的<

浏览 1提问于2012-12-09得票数 8

回答已采纳

1回答

并行约简的浮点相关数值稳定性问题

、、

我一直在寻找一些与浮动求和相关的在线资源和相关的准确性问题。例如：大多数人建议在处理任何现代硬件的浮点求和时，使用某种形式的手动干预。例如(1)使用Kahan的浮点求和算法，或(2)排序和和更接近的幅度数，等等。这些细微差别是由MPI_AllReduce或OpenMP约简核处理的吗？

浏览 0提问于2019-09-26得票数 0

回答已采纳

2回答

为什么静态计划循环的OpenMP还原条款是不确定的？

、、

我一直在致力于一个多GPU项目，在那里，我有问题，以获得不确定的结果。我惊讶地发现，由于在CPU上执行了一个约简子句，我获得了不确定的结果。在“使用OpenMP”一书中-下一步是这样写的也许<

浏览 6提问于2022-02-15得票数 2

1回答

将OpenMP缩减为C++模板数组指定的大小会导致未定义的行为。

、

我对OpenMP还不熟悉，但我正试图使用它来加速对具有大量行和少量列的2D数组条目的一些操作。同时，我使用约简来计算每列中所有数组值的总和。这种情况很少发生，以至于我在隔离bug时遇到了很多困难，但我现在想知道这是否是因为我在OpenMP还原中使用了这个OpenMP模板参数。我注意到，询问如何在缩减中使用模板类

浏览 2提问于2018-04-23得票数 3

回答已采纳

6回答

并行化:pthread还是OpenMP？

、、、

在科学计算领域，当涉及到共享内存并行化时，大多数人使用OpenMP作为准标准。有没有什么理由(除了可读性之外)在pthread上使用OpenMP？后者似乎更基础，我怀疑它可以更快、更容易优化。

浏览 0提问于2009-06-01得票数 44

回答已采纳

2回答

运算符"-“的Openmp缩减

、

a) a = omp_get_thread_num()+1; std::cout << "Output:" << a;} 我使用openmp缩减得到了错误的输出...对于下面的代码，reduction(+)给出threadnum()的sum输出，但是当我提到reduction (-)时，它给出相同的输出...对于&

浏览 0提问于2013-05-15得票数 3

回答已采纳

2回答

OpenMP降低速度较慢

有两个版本的openmp代码，有精简的和不精简的。sum) x = (i-0.5)*step; } partial_sum += + 4.0/(1.0+x*x);#pragma omp critical sum += partial

浏览 4提问于2013-12-06得票数 2

3回答

没有线程本地副本的OpenMP减少数组

、、

我希望OpenMP将一个大数组简化为一个较小的动态数组。small[] = {3, 6, 9};overflowlarge 必须支持OpenMP 3.1 (因此不能像那样使用OpenMP 4.5的数组缩减)small的每个元素都从相同数量的large元素中减少(另

浏览 3提问于2021-06-28得票数 0

回答已采纳

1回答

使用OpenMP查找所有大数除数的正确方法

、

在我上大学的课堂上，我需要在C++中创建一个程序，该程序可以找到所有的大数量的除数。我需要用几种方法来做。其中之一是使用OpenMP。到目前为止我有这样的想法： stack<unsigned long long> numbers; #numbers.empty() ){

浏览 3提问于2021-07-07得票数 1

回答已采纳

1回答

Openmp:如何从不同的线程收集数组？

、、、、

我是一个OpenMP新手，我被一个问题困住了！我有一个在循环中求和的数组，但我在并行化它时遇到了问题。你能建议一下怎么做吗？主循环绘制如下： END SUBROUTINE messy_subroutine_that_sums_A 我的问题是，我从所有线程收集A的所有尝试都失败了。如果您注意到，

浏览 2提问于2015-08-13得票数 0

1回答

如何为每个线程OpenMP收集数据

、

我对OpenMP并不熟悉，并试图解决从线程中收集数据的问题。本文研究了OpenMP在蒙特卡罗方法(正方形内刻圆)上的应用实例。我理解了以下代码的工作原理：#pragma omp parallel for num_threads(threadNum) shared(threadNum但主要的问题是如何将信息直接收集到数组或向量<

浏览 7提问于2020-04-20得票数 0

1回答

如何在python图形工具中检查OpenMP使用情况

、、、

我正在使用算法的python graph-tool，以便在一个大图中找到最小割线。我的算法需要多次调用这个函数，这似乎是瓶颈。因此，我想确保它是否像使用OpenMP一样高效地运行。但是，在使用openmp_set_num_threads(n)更改线程数量时，对于不同数量的线程，我</e

浏览 0提问于2018-07-29得票数 1

3回答

openmp reduce技术

、、、、

我有这个for循环，它可以找到最小和最大长度，正如你可以看到的，我这里有两个值要减少，而在查看OpenMP时，我只能注意到它只为一个值提供了减少技术。m_patterns[i].size() > m_lmax) }// end for loop 我可以做以下事情吗#pragma omp parallel for reduction (min:m_lmin,ma

浏览 0提问于2012-04-13得票数 4

回答已采纳

2回答

当MATLAB mex文件完成并将数据传回C++时，是否会产生开销？

、

我已经用C++写了一个mex文件来提高MATLAB中慢“for循环”的速度。我已经写了两个版本，一个没有openMP，一个有。所获得的收益非常好，但是在测试计时时，我注意到，由于多线程，一个意外的结果:当mex文件传递回MATLAB时出现时间延迟。每个mex文件完成后，随着下一次计算的进行，时间将显示在MATLAB命令窗口中。此外，当多线程mex

浏览 0提问于2011-09-18得票数 1

1回答

Eigen3矩阵乘法性能取决于处理器？

、、、、

在过去的几个月里，我一直在使用计算机矩阵乘法技术，并使用openMP和eigen3进行了一些测试。GBvoid matrix4openmp(void) int j; for (j=0*序列算法与OMP不同，它是m乘法的最简单的版本，可以在这里看到：。 *启动eige

浏览 4提问于2012-12-10得票数 1

回答已采纳

1回答

OpenMP和CPU亲和性

、、、

sched_setaffinity或pthread_attr_setaffinity_np可以在OpenMP下设置线程亲和性吗？相关：

浏览 3提问于2011-11-30得票数 10

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用于在C++中减少复杂变量的OpenMP的优雅(和典型)解决方案？

为什么这个OpenMP程序每次都给我不同的答案？

顺序和并行版本给出了不同的结果--为什么？

OpenMP和MKL线程

并行约简的浮点相关数值稳定性问题

为什么静态计划循环的OpenMP还原条款是不确定的？

将OpenMP缩减为C++模板数组指定的大小会导致未定义的行为。

并行化:pthread还是OpenMP？

运算符"-“的Openmp缩减

OpenMP降低速度较慢

没有线程本地副本的OpenMP减少数组

使用OpenMP查找所有大数除数的正确方法

Openmp:如何从不同的线程收集数组？

如何为每个线程OpenMP收集数据

如何在python图形工具中检查OpenMP使用情况

openmp reduce技术

当MATLAB mex文件完成并将数据传回C++时，是否会产生开销？

Eigen3矩阵乘法性能取决于处理器？

OpenMP和CPU亲和性

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐