为什么我的OpenMP程序不能随着线程数量的增加而扩展？

、、、

我编写了一个程序来计算1M个数组的和，其中所有元素= 1。我使用OpenMP进行多线程处理。但是，运行时并不随线程的数量而扩展。< endl; cout << sum << endl; } 不同N_TH

浏览 56提问于2021-10-22得票数 0

1回答

OpenMP运行时间

、

我正在使用OpenMP运行一些并行工作，但发现加速不能很好地扩展。然后我发现，随着线程数量的增加，执行相同数量的工作所需的时间也会增加。double end = omp_get_wtime(); return 0;

浏览 2提问于2014-12-13得票数 2

1回答

元素矩阵乘法的并行化

、、

我目前正在优化代码的部分，因此执行一些基准测试。!$OMP END PARALLEL DO现在发生的奇怪的事情是，不管线程数量(在1到4之间)，执行时间或多或少保持不变(+- 10%)，但是CPU时间却随着线程数量

浏览 5提问于2013-07-23得票数 5

回答已采纳

2回答

用C语言实现OpenMP的基准测试

、、

我正在寻找一个C语言的OpenMP基准测试，只是一个简单的(无用的)任务，证明这项技术真的有效。

浏览 2提问于2013-11-17得票数 0

1回答

为什么我的程序的性能会随着线程数量的增加而下降？

、、

我正在学习多线程编程。我写了一个简单的程序，但是我的程序的性能随着线程数量的增加而下降。我想在所有线程完成thread_local_init()之后测量我的程序，所以我使用flag来同步。但是随着线程<e

浏览 3提问于2021-02-02得票数 0

1回答

为什么我的多线程示例中的时间随着线程数量的增加而增加

、、、

如何编写多线程windows应用程序，在给定的线程数中运行程序，并显示每个线程所用时间的结果。我试图创建它，但我可以看到我的程序显示不正确的结果，这意味着当我增加线程的数量时，每个线程所花费的时间也会增加(如消息框所示)。当它为2时，两个线程各自花费

浏览 0提问于2012-06-18得票数 0

回答已采纳

1回答

如何测量Linux中OpenMP代码的内存使用率？

、、、

如何测量OpenMP代码的内存使用情况？我相信，内存使用量会随着线程数的增加而减少。我使用的是Linux和英特尔Fortran编译器。

浏览 0提问于2017-04-26得票数 0

2回答

OpenMP与矢量化的比较

、

给定一个示例函数(下面给出示例)，for循环可以使用OpenMP并行化，也可以使用向量化(假设编译器执行向量化)进行向量化。float* c, int n) for(int i = 0; i < n; i++) c[i] = a[i] * b[i];}注意:我没有给出关于SSE的不同版本，处理器/核的数量(随着<em

浏览 3提问于2012-05-09得票数 2

回答已采纳

1回答

随着线程数量的增加，OpenMP实现变得越来越慢

、

我一直在努力学习如何使用OpenMP。然而，我的代码似乎在串行和并行中运行得更快。为了说明这一点，我做了一个实验。，并将运行时间作为内部循环迭代次数(N)和使用的线程数量的函数进行了比较。这个实验的代码如下。<< " " << parallel[i][j]<< std::endl;

浏览 0提问于2017-11-08得票数 1

1回答

OpenMp:如何确保每个线程在动态调度中至少执行一次迭代

、

我使用循环迭代的动态调度。但是，当每次迭代中的工作太小时，一些线程就不能工作，或者当有大量线程时。例如：有100个迭代和90个线程，我希望每个线程至少执行一次迭代，剩下的10个迭代可以分发给已经完成任务的线程。我怎么能这么做？

浏览 1提问于2020-02-29得票数 0

回答已采纳

1回答

OpenMP线程创建

、、、、

在下面的代码中，OpenMP运行时将重新创建线程还是重用以前创建的线程-即使用线程池？一些同事认为，它会重新创建线程，因为“#并行”子句嵌套在for中；我对此表示怀疑，并对GDB进行了一些测试，这表明这不是事实。线程实际上是重用的。

浏览 0提问于2017-07-24得票数 1

1回答

如何设计从Kafka获取客户端事件的API？

、、、

当我的服务的每个客户端都有自己的kafka使用者时，我会考虑架构模式。每个客户端都有自己的offset。所以我的应用程序接口允许使用offset来获取客户端事件。它的系统设计很好吗？或者，什么是正确的API设计来获取事件？

浏览 0提问于2019-03-01得票数 0

1回答

从openmp循环调用顺序英特尔mkl

、、

由于zaxpy使用的“向量”不是那么大，我尝试使用openmp来加速程序。我用英特尔的vtune工具检查了运行时间(这就是debug all标志的原因)。我有一个i5 4430，这意味着4个线程和4个物理核心。使用openmp的时间: 107s；不使用openmp的时间: 44s 有趣的是，随着线程数

浏览 18提问于2020-04-01得票数 1

2回答

循环内部的OpenMP并行化花费太长时间。

、

我正在准备一个必须使用OpenMP并行化的程序。程序应该比较两个帧，其中两个帧必须一个块地进行比较，而OpenMP必须以两种方式应用:一种是帧工作必须在线程之间分割，另一种是必须在线程之间通过块级来划分工作，找到每个比较的最小成本。这是可行的，并且随着使用的线程数量的增加，程序</em

浏览 5提问于2020-08-03得票数 0

回答已采纳

1回答

openMP的并行化效率

、、、

我有一个C++代码，其中包含在8线程计算机上与openMP并行的多个for-循环.无论如何，<e

浏览 2提问于2012-06-26得票数 0

回答已采纳

1回答

用于循环的两个omp之间的差异

、、

我刚刚开始使用OpenMP，并且正在编写一个函数，该函数将数组划分为numBlocks块，并通过检查每个块的blockSize元素(在我提供的代码中，直方图是记录块中元素的可分性由整数1到numBuckets++){ // Compute histogram here by examining array[idx]如果我将线程数

浏览 0提问于2013-04-15得票数 1

回答已采纳

1回答

正确使用openMP目标构造

、

我正在尝试弄清楚我是否正确地使用了Openmp 4结构。loop1{} loop2{} } } 我的整体代码正在工作，并且随着线程的增加而变得更快，但我想知道代码是否在目标设备(Xeon phi)上正确执行。此外，如果我删除所有omp内容并按顺

浏览 2提问于2014-06-24得票数 0

1回答

基于ARM皮层A9双核(Linux或VxWorks)的多线程

、、、

我正在研究双核(尤其是在嵌入式系统中)是如何有益的。我想比较两个目标:一个是手臂皮质-A9 (925 MHz)双核，另一个是臂皮质-A8单核。我有一些想法(请看下面)，但我不确定，我会使用双核功能：如何在不同的核心上执行多个线程(没有OpenMP，因为它不能在我的目标上工作，而且它与VxWorks3-是否可以添加C标志以指示CPU核的数量</em

浏览 3提问于2017-06-16得票数 0

1回答

为什么卡桑德拉要创造很多线程？

我有3000个IOT设备，每10秒向卡桑德拉发送数据。早些时候，卡桑德拉服务每天都会被退出(失败)。因此，我们将服务器增加到62 Gb RAM和10 to硬盘。我注意到taht cassandra已经创建了140个线程。请找出自动屏幕截图。 📷

浏览 0提问于2022-11-30得票数 0

3回答

增加xcode上的线程数会增加程序时间。

、、

我是openmp的新手，目前正尝试在mac上并行xcode中的矩阵乘法。omp_set_num_threads(4); #pragma omp paral

浏览 2提问于2019-03-06得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

OpenMP运行时间

元素矩阵乘法的并行化

用C语言实现OpenMP的基准测试

为什么我的程序的性能会随着线程数量的增加而下降？

为什么我的多线程示例中的时间随着线程数量的增加而增加

如何测量Linux中OpenMP代码的内存使用率？

OpenMP与矢量化的比较

随着线程数量的增加，OpenMP实现变得越来越慢

OpenMp:如何确保每个线程在动态调度中至少执行一次迭代

OpenMP线程创建

如何设计从Kafka获取客户端事件的API？

从openmp循环调用顺序英特尔mkl

循环内部的OpenMP并行化花费太长时间。

openMP的并行化效率

用于循环的两个omp之间的差异

正确使用openMP目标构造

基于ARM皮层A9双核(Linux或VxWorks)的多线程

为什么卡桑德拉要创造很多线程？

增加xcode上的线程数会增加程序时间。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐