静态变量的OpenMP线程亲和性_在OpenMP中将静态类成员设为线程私有_设置std::threads的线程亲和性 - 腾讯云开发者社区

c++、c、posix、openmp

sched_setaffinity或pthread_attr_setaffinity_np可以在OpenMP下设置线程亲和性吗？相关：

浏览 3提问于2011-11-30得票数 10

回答已采纳

1回答

在OpenMP并行区内设置亲和性

c++、openmp

我正在尝试看看是否可以使用pthread_setaffinity_np()调用在OpenMP区域内设置亲和性，假设底层实现对OpenMP工作者使用了pthreads。在下面的示例代码中，设置亲和性的调用没有返回错误，sched_getcpu()调用也确认核心亲和性已正确设置。但是，与使用GOMP_CPU_AFFINITY环境变量设置亲和性相比，这种设置亲和性的方法会导致相当大的性能降级，这表明使用pthread_setaffinity_np()存在一些潜在问题。在OpenMP区域中使用pthread_setaffinity_np()有什么已知的问题吗？对于我的用例，我需要使用作为“主”的pth

浏览 1提问于2021-10-14得票数 1

1回答

设置OpenMP中的核数

multithreading、openmp、intel、cpu-cores

我在英特尔®至强®处理器E5-1650 v3 上运行我的程序处理器有6个CPU(6核)，我正在尝试设置我的程序正在使用的CPU数量。我的应用程序正在使用openmp。我并不是要设置线程的数量，而是要设置CPU的数量。我该怎么做呢？

浏览 4提问于2016-01-29得票数 2

2回答

我是不是用OpenMP干扰了其他程序？

c++、multithreading、openmp

我使用OpenMP进行如下循环： #pragma omp parallel for for (int out = 1; out <= matrix.rows; out++) { ... } 我在一台有64个CPU的机器上做了大量的计算。这很有效，但我的问题是:我是否干扰了这台机器上的其他用户？通常，它们只运行单线程程序。它们还会100%运行吗？显然，我会干扰其他多线程程序，但我会干扰单线程程序吗？如果是，我可以预防这个吗？我认为可以用omp_set_num_threads来设置CPU的最大数量。我可以将其设置为60，但我不认为这是最好的解决方案。理想的解决方案不会干扰其他单线程程

浏览 0提问于2013-11-13得票数 1

1回答

多核应用程序cygwin

cygwin、multicore

如果我运行一个并行的应用程序(使用f.e.OpenMP)在cygwin内的windows多核上-我是否拥有windows计算机提供的完整多核性能，或者由于cygwin层的存在，速度是否会显著降低？有什么经验吗？

浏览 1提问于2010-05-12得票数 2

2回答

Openblas、OpenMP和R有没有合适的测试？

r、openmp

我正在尝试用Openblas和OpenMP设置一个多线程的R。我使用的是AMD 82308核处理器的OpenSuSE 12.2。在和争论了一段时间后，有人建议我把它打包并尝试一下openblas，我已经有了。第一。有一些关于opensuse 12.2的报道，gcc的openmp被打破了，所以我想我应该测试一下。我转到，编译并执行示例文件hello.c，所有线程都响应。第二。我创建了一个openblas的git克隆。我阅读了说明并执行了“make USE_OPENMP=1”，然后执行了“make PREFIX=/usr/lib64/OpenBLAS install”程序安装并通过了所有检查，

浏览 2提问于2013-04-08得票数 1

1回答

Windows SetThreadAffinityMask不起作用

c++、windows、winapi、numa、setthreadaffinitymask

我已经编写了一个小的测试程序，在其中我尝试使用Windows API调用NUMA将线程锁定到单个SetThreadAffinityMask节点。我使用GetNumaNodeProcessorMask API调用检索节点的CPU位掩码，然后将该位掩码与GetCurrentThread返回的线程句柄一起传递给SetThreadAffinityMask。下面是我的代码的一个大大简化的版本： // Inside a function called from a boost::thread unsigned long long nodeMask = 0; GetNumaNodeProcessorMask

浏览 36提问于2012-01-24得票数 2

回答已采纳

1回答

OpenMP与c++中的资源管理

c++、openmp

我有一个资源需要在访问之间保留它的状态。当使用OpenMP并行程序时，我希望确保每个线程都有自己的副本，并且实例不会被销毁，并为每个并行区域重新创建。为此，我使用了一个全局变量threadprivate。下面，我有一个简单的测试用例来说明这个设置。我有两个问题：是否保证在程序执行期间每个线程只创建一次资源(下面是obj)？当我在四个线程上运行示例程序时，每个线程都报告"Obj created.“以及“国家开始.”但是只有零号线报道"Obj被毁了.“。这里发生什么事情？ #ifdef _OPENMP #include <omp.h> #endi

浏览 3提问于2016-03-15得票数 0

回答已采纳

2回答

如何在tensorflow 1.14.0中有效地使用OpenMP并行性

python、tensorflow、openmp、python-3.6

我目前正在尝试寻找一种有效的方法，使用tensorflow在一定数量的内核上运行机器学习任务。从这些信息中，我发现有两种主要的方法可以做到这一点。第一个是使用两个tensorflow变量intra_op_parallelism_threads和inter_op_parallelism_threads，然后使用此配置创建一个会话。第二个是使用OpenMP。通过设置环境变量OMP_NUM_THREADS，可以操作为进程派生的线程数量。当我发现通过conda和pip安装tensorflow会产生两种不同的环境时，我的问题就出现了。在conda install中，修改OpenMP环境变量似乎改变

浏览 1提问于2019-10-04得票数 2

1回答

OpenMP中可重用的私有动态分配数组

c、mpi、openmp

在c语言中，我使用OpenMP和MPI并行化一些矩阵操作，在矩阵上运行的一些函数是用Fortran编写的。Fortran函数需要传递一个仅在函数内部使用的缓冲区数组。目前，我正在每个并行部分分配缓冲区，类似于下面的代码。 int i = 0; int n = 1024; // Actually this is read from command line double **a = createNbyNMat(n); #pragma omp parallel { double *buf; buf = malloc(sizeof(double)*n); #pragma omp fo

浏览 3提问于2014-03-23得票数 3

回答已采纳

1回答

Fortran，Open MP，间接递归和有限堆栈内存

fortran、openmp、gfortran

关于堆栈空间、OpenMP以及如何处理这些问题，在其他帖子上有许多响应。但是，我无法找到真正理解为什么OpenMP调整编译器选项的信息：为什么-fopenmp在gfortran中暗示-frecursive的原因是什么？文件上说：通过强制在堆栈上分配所有本地数组来允许间接递归然而，我没有足够的上下文来理解这一点。为什么并行化需要间接递归？为什么并行化希望所有本地数组都在堆栈上？我希望了解这些选项的后果，比如使用-fmax-stack-var-size=n，以避免堆栈溢出的问题。

浏览 1提问于2018-11-27得票数 4

回答已采纳

2回答

OpenMP线程映射到物理核心

openmp、parallel-processing

所以我在网上四处寻找了一段时间，但都没有用。我刚开始使用OpenMP，所以对这里的术语不太了解，但是有没有办法从OMPThread (由omp_get_thread_num()；给出)和线程将在其上运行的物理核心中找出特定机器的映射？另外，我对OMP分配的线程到底是如何分配的很感兴趣，例如，当相同的代码在同一台机器上运行时，线程0是否总是在相同的位置运行？谢谢。

浏览 2提问于2011-01-18得票数 0

回答已采纳

1回答

在并行调度(运行时)中使用OMP_SCHEDULE和#杂注omp

c++、openmp、schedule

我正在尝试理解如何在C++中使用OpenMP的schedule(runtime)指令。经过一些研究，我发现了和。我得出结论，我需要将varibale OMP_SCHEDULE设置为某个值。但是，我不知道如何做到这一点，我也没有找到任何有效的C++示例来解释如何正确地做到这一点。有人能给我解释一下如何设置变量并提供一个有效的C++示例吗？

浏览 1提问于2013-03-20得票数 2

回答已采纳

1回答

混合并行化：“只让'my_id ==0‘进程执行openMP调用”可能吗？

multithreading、fortran、mpi、openmp

我对混合并行编码非常陌生，所以我想知道这种概念是可能的，以及它是否会导致不好的并行效率。假设我需要A例程和B例程。A很难与MPI并行化，而B则相对简单。因为我希望这段代码在某种程度上是可伸缩的，所以我将尽可能多地利用MPI并行化。我粗略地理解了thread和process的概念，我假设total threads的数字是n_threads x n_process。 program Hybrid use MPI use OMP_LIB call MPI_INIT ( ierr ) * call MPI_COMM_SIZE ( MPI_COMM_WORLD, n_process,

浏览 0提问于2020-06-07得票数 0

1回答

使用openMP指定特定处理器

c++、openmp

您好，我在一个系统上运行linux，其中每个节点有64个内核，每个节点有4个处理器，每个处理器有16个内核。我正在尝试在一个特定的处理器(在16个内核上)上运行C++程序，当我将OMP_NUM_THREADS设置为16并运行我的程序时，在HTOP中查看的结果显示工作分布在4个处理器上，我如何将OpenMP设置为只在一个处理器上运行

浏览 2提问于2012-02-29得票数 1

回答已采纳

1回答

调用moveToThread()不会将QObject移动到另一个线程。

c++、multithreading、qt

假设functionClass是从QObject派生的类。在我的QMainWindow类(它还没有启动任何其他线程)的类构造函数中，我有以下代码： QThread workThread; functionClass *functionClassObj = new functionClass; cout << functionClassObj->thread()->currentThreadId() << endl; // prints 0x16c functionClassObj->moveToThread( &workThread ); c

浏览 1提问于2011-11-22得票数 4

回答已采纳

4回答

给定的线程运行在哪个内核上？

c、pthreads、cpu、openmp

有没有一个函数或任何其他方法可以通过编程的方式知道我的程序的给定线程(pid)在哪个处理器的内核上运行？如果可能的话，OpenMP或Pthread解决方案都会对我有所帮助。谢谢。

浏览 1提问于2011-04-28得票数 4

2回答

openMP用相同的种子产生不同的随机数

c++、openmp、srand

我是openMP新手，在我的程序中需要复杂的模拟，为了重复结果，每个模拟都设置了种子，但是在实现openMP时，每次运行它都会产生不同的结果。因此，我编写了一个简单的示例来检查这个问题，如下所示，每次都生成不同的结果： #include <iostream> #include <omp.h> using namespace std; int main () { double A[10]; #pragma omp parallel for for( int i=0;i<10;i++){ srand(i+1); int m = rand()%1

浏览 2提问于2014-01-03得票数 1

回答已采纳

1回答

是否有一种简单的方法来准备用于并行调用的Fortran代码？

memory-management、parallel-processing、fortran、openmp

我希望在一个C++程序中并行地使用OpenMP解决多个大型ODE系统。由于某些原因，我需要使用一个仅能找到Fortran 90子例程的ODE求解器，而且代码太大，无法简单地将其转换为C。我知道Fortran广泛地使用静态内存，因此我必须为并行调用提供最高级的代码；但我对这种语言并不十分熟悉，因此：我的问题有标准的(自动化的)解决方案吗？我必须修改代码的哪些部分？第二个问题归结为: Fortran如何、何时为变量分配和释放内存，以及(如何)从函数参数中重用内存？到目前为止，我已经发现COMMON部分对应于C中的全局变量，但是可以使用Fortran的OpenMP指令!$O

浏览 3提问于2014-03-13得票数 2

回答已采纳

1回答

默认情况下，OpenMP将所有静态变量视为线程私有变量。

c、parallel-processing、openmp

我有一个C函数，需要在多个输入上并行运行。我试图使用OpenMP来实现这个目的，问题是，我使用的函数是使用一些内部静态变量来进行内部计算。当试图并行运行此函数的多个实例时，程序会崩溃，原因是多个线程正在访问同一个内存区域。这可以通过将每个静态变量定义为“线程私有”来解决，但是由于我有许多内部变量，这有点过分。在默认情况下，是否有任何方法使OpenMP将所有变量视为“线程私有”？

浏览 0提问于2019-09-12得票数 4

回答已采纳

1回答

OpenMP:调度性能

openmp

我正在研究OpenMP fortran。我有个关于日程安排的问题。那么，从这两个选项中，哪一个会有更好的性能呢？ !$OMP PARALLEL DO PRIVATE(j) SCHEDULE(STATIC) do j=1,l call dgemm("N","N",..) end do !$OMP END PARALLEL DO !$OMP PARALLEL DO PRIVATE(j) do j=1,l call dgemm("N","N",..) end do !$OMP END PARALLEL DO

浏览 1提问于2014-03-31得票数 0

回答已采纳

1回答

任务不会使用OpenMP并行运行。是我的设置还是我的代码出错了？

c++、multithreading、task、openmp

我正在使用OpenMP成功地将c++代码中的循环并行化。我试图更进一步，使用OpenMP任务。不幸的是，我的代码行为非常奇怪，所以我编写了一个最小的示例，并发现了一个问题。我想定义几个任务。每个任务应该由一个空闲线程执行一次。不幸的是，我只能让所有线程执行每个任务，或者只有一个线程按顺序执行所有任务。下面是我的代码，基本上是按顺序运行的： int main() { #pragma omp parallel { int id, nths; id = omp_get_thread_num(); #pragma omp single

浏览 1提问于2017-11-13得票数 1

回答已采纳

1回答

OpenMP线程私有和私有线程之间的区别

parallel-processing、openmp、private

我正在尝试使用OpenMP并行化一个C程序。我想知道更多关于以下方面的情况：线程私有指令与私有子句和在这种情况下我们必须使用它们中的任何一个。据我所知，区别在于threadprivate的全局范围和跨并行区域的保留值。我在几个例子中发现，当一段代码包含一些必须私有化的全局/静态变量时，这些变量包含在一个threadprivate列表中，并且它们的初始值被使用版权复制到私有副本中。但是，是否有任何规则阻止我们使用私有子句来处理全局/静态变量？可能有任何实现细节吗？我在OpenMP3.0规范中找不到任何解释。

浏览 2提问于2013-08-02得票数 20

回答已采纳

1回答

具有Bays-Durham的L‘厄瓜多尔随机数发生器

thread-safety、openmp、montecarlo

我正在用蒙特卡罗模拟来寻找PI的小数位。到目前为止还不错，但是OpenMP进来了，我意识到ran2，可以说是最好的RGN，并不是线程安全！实现是。由于我没有使用过OpenMP，也没有在多线程上做过很多事情，所以我不得不使用OpenMP来保证这个线程的安全。到目前为止，我所知道的是，如果函数不修改非本地内存，并且不调用任何函数，那么它就已经是线程安全的了。在这种情况下，有3个变量是静态的，因此如果被不同的线程使用，将被修改。一种可能的解决方案是以线程安全的方式调用它，方法是将ran2的调用封装在关键部分中，但这没有任何意义，因为我没有得到加速比。有人能给我指点如何继续这一点，或如果有人有任

浏览 0提问于2019-06-21得票数 0

回答已采纳

2回答

OpenMp:线程本地成员

c++、openmp

我目前正在编写一段由前同事使用OpenMP编写的代码。然而，我本人没有使用OpenMP的经验，虽然我只是通过阅读他的代码来理解基本知识，但我目前还在琢磨如何声明一个线程本地成员以进行我自己的修改。非常简化的版本中的当前代码如下所示： struct Worker { void work() { //... } }; ------------------------------------------------------------------- Worker worker; #pragma omp parallel for for (int i = 0; i < n;

浏览 3提问于2014-07-23得票数 0

回答已采纳

2回答

Fortran中的OpenMP

fortran、openmp

我很少使用fortran，但我的任务是将遗留代码重写为并行运行。我使用gfortran作为我的编译器选择。我在上找到了一些很好的资源以及其他一些资源。我的问题是，在我添加任何OpenMP指令之前，如果我只是编译遗留程序： gfortran示例1.F90 -o Example1 一切正常，但即使不添加指令也要打开openmp编译器选项： -o Example1示例1.F90 gfortran -openmp 当我运行遗留程序时，最终出现了分段错误。使用我编写的较小的测试程序，我已经成功地使用-openmp编译了在多线程上运行的其他程序，但我很困惑为什么只启用选项而不启用指令会导致seg错误。

浏览 2提问于2010-05-20得票数 4

回答已采纳

2回答

线程亲和性和进程亲和性有什么区别？

.net、multithreading

线程亲和性和进程亲和性有什么区别？如果我有两个线程，并且我有一个双核机器，那么有可能在两个核上并行运行这两个线程吗？如果我使用处理器亲和性掩码，那么我可以控制进程在核心上的执行，但是当我必须在特定的核心上运行线程时，我如何使这些线程特定于核心？一个非常简单的例子将不胜感激。

浏览 2提问于2010-03-24得票数 12

1回答

如何通过OpenMP函数在QThread中强制使用多核

c++、qt、pthreads、openmp、qthread

我有一个在OpenMP中非常并行化的函数，当从一个简单的控制台可执行文件启动时，它会使机器的每个内核饱和，并在处理器数量中以线性更快的速度返回结果。 void updateStateWithAParallelAlgorithm() { #pragma omp parallel for { // do parallel things, update positions of particles in a physics simulation } } 现在，在我的Qt程序的QThread中也使用了这个函数。问题是我必须在每次调用updateStateWithAPar

浏览 4提问于2012-06-25得票数 3

回答已采纳

2回答

如何改善OpenMP在安卓系统上的糟糕性能？

android、c++、parallel-processing、openmp、multicore

我编写了一个用于安卓系统的图像处理应用程序()，其中包含一些用JNI封装的C++代码。为了在多核处理器上获得一些加速，我使用openmp "parallel for“指令注释了昂贵的循环。问题是，在x86上，我在4核处理器上获得了从x3到x5的一些加速，但在安卓上，激活OpenMP (使用-fopenmp)在ARM 32位上没有任何加速，甚至在64位armv8 Snapdraon810上的代码速度也变慢了。我错过了什么吗？有没有人能观察到android+arm的加速比得上x86 cpus？在互联网上有很多关于如何激活OpenMP的教程，但没有基准测试显示加速。有什么建议吗？我找

浏览 0提问于2016-06-23得票数 6

1回答

我的openmp代码不能在服务器上工作？

c++、gcc、openmp

我有一个简单的openmp c++代码，类似于： #include <cmath> #include <iostream> #include <stdio.h> #include <string> int main() { #pragma omp parallel for for(int n=0; n<10; ++n) { printf(" %d", n); } printf(".\n"); } 它在我的Mac计算机上并行运行(在安装了gcc48之后，

浏览 4提问于2015-08-22得票数 1

回答已采纳

1回答

openMP新手，有什么建议可以用openMP并行化以下代码吗？

c++、c、parallel-processing、openmp

openMP新手，有什么建议可以用openMP并行化以下代码吗？我想用openMP加速代码，并尝试在"sum -= ai*ak“的以下两个部分中添加#杂注omp for，因为热点分析显示这两个循环花费了大量的时间。但似乎一些竞争条件导致了错误的结果。有什么建议吗？ void ludcmp(float **a, int n, int *indx, float *d) { int i,imax,j,k; float big,dum,sum,temp; float *vv; vv=vector(1,n); *d=1.0; for (j=1;j<=n;j++) {

浏览 0提问于2019-11-10得票数 0

2回答

这是正确的openMP用法吗？(或者:我可以信任默认设置吗？)

c++、openmp、member

我现在是第一次使用openMP，我的头撞到了“数据成员不能是私有的”-rule。我想知道下面的说法是否有效，或者它最终是否会失效： class network { double tau; void SomeFunction(); }; void network::SomeFunction() { #pragma omp parallel for // <-the openMP call for (uint iNeu=0;iNeu<nNeurons;++iNeu) { neurons[iNeu].timeSinceSpike

浏览 0提问于2012-02-14得票数 3

回答已采纳

4回答

正确使用SetThreadAffinityMask

c++、multithreading

有12个核心，和12个线程运行..我想绑定一个线程到每个核心。这是我在每个线程开始时调用的。 int core=12; SetThreadAffinityMask(GetCurrentThread(),(1<<core)-1); 这就是我所知道的……我不知道这是不是合适的叫法。我不确定我是否理解了第二个参数是如何工作的。我还需要调用SetProcessaffinitymask吗？

浏览 0提问于2011-05-07得票数 10

回答已采纳

1回答

用多线程来模拟这种情况的好方法是什么？

c++、multithreading、parallel-processing、openmp

我正在visual studio中用c++编写一个程序，以便能够处理公园中的线路。我有我所有的客户在公园排队，我希望能够使用openmp的多线程为他们服务。当我放入杂注之类的东西时，我有多个线程同时为我创建的每个客户服务同一个客户，而不是我想要的。例如，如果我有两个线程和四个客户，线程1执行客户1，线程2执行客户2，那么我希望线程1同时执行客户3和线程2客户4。我不知道这是否可行，或者是否有更好的方法，但我需要使用openMP。

浏览 0提问于2012-11-20得票数 1

回答已采纳

1回答

为什么taskset对fedora没有影响？

c++、c、multithreading、parallel-processing、core

我正在尝试运行一个高度多线程的应用程序，并想用不同的内核( 0,1,2,3,4,5,6 ... 12)来测量它的性能。我在谷歌上看到了任务集， taskset 0x00000003 ./my_app 但是当我看到fedora的系统监视器时，它只显示一个内核运行100%，而其他内核只运行12%，0%，...etc。有没有办法告诉进程在特定的内核上运行。我也听说过像-t #no of cores这样的选项。喜欢 ./my_app -t2 对于0和1核..但是这也没有效果，我做错了什么，请任何人把我引向正确的方向。

浏览 0提问于2013-02-03得票数 0

回答已采纳

1回答

for循环的OpenMP优化调度

c++、multithreading、parallel-processing、openmp、scheduling

我需要一些OpenMP的帮助。如果一个线程以for循环结尾，那么它会帮助另一个线程分割它吗？我在循环中有一个循环，其中有断路；线程不是同时结束的，所以有一些线程有很多工作，还有其他线程已经完成了。(因此有未使用的核心)。我在corei7上运行我的程序，看起来OpenMP将循环划分为8个线程。但是，当一个线程完成任务后，利用率开始下降。 #pragma omp parallel for for(i = 0; i < Vector.size(); i++) { for(j = 0; j < othervector.size(); j++) { {some cod

浏览 2提问于2013-10-04得票数 1

回答已采纳

2回答

将线程私有预分配缓冲区提供给并行化for()循环？

c++、visual-studio-2008、openmp

我的程序包含一个for()循环，它处理一些原始图像数据，逐行处理，我想使用这样的OpenMP并行化： ... #if defined(_OPENMP) int const threads = 8; omp_set_num_threads( threads ); omp_set_dynamic( threads ); #endif int line = 0; #pragma omp parallel private( line ) { // tell the compiler to para

浏览 4提问于2011-10-20得票数 1

回答已采纳

1回答

-static和-fopenmp在gfortran中的分段故障

static、segmentation-fault、fortran、openmp

我在fortran中使用openmp，在程序完全完成之前，它只需写到一行代码，就会遇到分段错误，如下所示： 783 module Lines 784 785 character*80 eline, dline 786 787 contains 788 789 subroutine InitializeLines 790 print*, 'writing to eline' 791 write(eline,'(1x,79(''#''))') 792

浏览 2提问于2012-06-22得票数 2

回答已采纳

1回答

OpenMP num_threads(1)执行速度比没有OpenMP快

c++、c、multithreading、openmp

我在各种情况下运行了我的代码，这导致了我认为奇怪的行为。我的测试是在一个带有HT的双核英特尔xeon处理器上进行的。 No OpenMP‘#务实’语句，总运行时= 507秒，OpenMP‘#杂注’语句指定1核心，总运行时= 117秒使用OpenMP‘#杂注’语句指定2核，总运行时= 150秒使用OpenMP‘#杂注’语句指定3个核心，总运行时= 157秒使用OpenMP‘#杂注’语句指定4个核心，总运行时= 144秒我想我不明白为什么注释掉我的openmp行会使程序在一个没有openmp的线程和一个带有openmp的线程之间慢很多。我所改变的只是： //#pragma omp pa

浏览 0提问于2010-05-26得票数 11

1回答

C++对象构造函数中Openmp的使用

c++、openmp

我可以在C++对象的构造函数中使用openmp吗？当有一个具有这种构造函数的全局静态对象时，将做些什么？

浏览 0提问于2010-07-28得票数 0

回答已采纳

1回答

OpenMP Pi示例结果总是改变而不是3.1415

c、openmp

我是openMP和C的新手，我试过"Introduction to OpenMP - Tim (英特尔)“的Pi例子，但结果不是3.14。我把密码和老师比较一下。他们是一样的。但结果是不同的 #include <omp.h> #include <stdio.h> #include <stdlib.h> //OpenMP example program: hello; static long num_steps = 100000; #define NUM_THREADS 2 double step; int main() { int nnu

浏览 4提问于2015-08-13得票数 0

回答已采纳

1回答

Openmp没有加速并行循环

c、multithreading、performance、parallel-processing、openmp

我有以下令人难堪的并行循环 //#pragma omp parallel for for(i=0; i<tot; i++) pointer[i] = val; 为什么取消#杂注行的注释会导致性能下降？当我使用openmp并行化这个for循环时，我的程序运行时间略有增加。既然每个访问都是独立的，那么它不应该大大提高程序的速度吗？有没有可能，如果这个for循环不是针对较大的tot值运行的，那么开销是否会降低速度？

浏览 0提问于2012-11-26得票数 3

回答已采纳

1回答

循环块残留器的OpenMP动态

for-loop、openmp

在OpenMP中为for循环指定块大小时，如果存在余数，是否由编译器处理？例如，如果我迭代13个点，块大小为4和3个线程，假设所有线程都被使用，其中一个线程是否会被赋予第5个点，或者我需要指定这个点吗？

浏览 0提问于2015-06-24得票数 1

1回答

OpenMP在多插槽/多核系统上仅检测到单核

c++、openmp

我用C++编程，并使用OpenMP进行并行化。机器有2个CPU插座，每个插座8个内核。由于我使用英特尔编译器进行编译，因此我设置了以下环境变量 export KMP_AFFINITY=verbose,scatter 使用verbose选项，我可以在运行二进制文件时看到以下消息。 [0] OMP: Info #204: KMP_AFFINITY: decoding x2APIC ids. [0] OMP: Info #202: KMP_AFFINITY: Affinity capable, using global cpuid leaf 11 info [0] OMP: Info #154:

浏览 60提问于2017-02-23得票数 2

回答已采纳

1回答

如何使用OpenMP在C++中实现监视器？

c++、multithreading、openmp、producer-consumer

我正在用C++开发一个，在使用OpenMP时，如何实现一个监视器呢？我在OpenMP中找不到像这样的东西，也不能在某些条件下实现等待/通知，就像维基百科中的例子一样。

浏览 0提问于2017-10-20得票数 1

4回答

核心上循环的OpenMP分割

c++、openmp

我正在尝试使用sse指令和openmp并行执行一些应用程序。关于openmp部分，我有如下代码： for(r=0; r<end_condition; r++){ .. several nested for loops inside .. } 我想将这个循环划分到多个内核的r上，例如，当使用两个内核时，一个内核应该执行r=0。r=end_condition/2-1，另一个r=end_condition/2.r=end_condition-1。循环的迭代之间没有通信，因此它们可以并行运行，在r循环结束时，结果应该是同步的。如何使用openmp指令以这种方式将其分配到内核？我必须在r

浏览 0提问于2011-11-29得票数 2

1回答

目标数据和目标数据之间的差异？如何在没有团队指令的情况下进行团队/线程配置？

c、compiler-construction、parallel-processing、openmp、gpgpu

关于新的OpenMP 4.0，我有两个问题。首先，我不明白目标数据和目标数据之间有什么区别？根据规范，目标数据创建了一个新的数据环境。那么，数据环境是什么呢？顺便问一下，我们可以将OpenMP目标数据比作OpenACC数据指令吗？第二个问题如下： extern void init(float*, float*, int); extern void output(float*, int); void vec_mult(int N) { int i; float p[N], v1[N], v2[N]; init(v1, v2, N); #pragma omp targe

浏览 2提问于2013-11-18得票数 0

回答已采纳

3回答

_fread_nolock，_fseek_nolock的目的是什么？

c++、windows、multithreading、fread、fseek

我们有一个C++类，它基本上是从二进制文件中读取和写入向量。将单个向量加载到内存中的示例性读取函数如下所示： int load (const __int64 index, T* values) const { int re = _fseeki64(_file, index * _vectorSize + _offsetData, SEEK_SET); assert(re == 0); size_t read = fread(values, sizeof(T), _vectorElements, _file); assert(read == _vectorElements);

浏览 10提问于2009-12-11得票数 0

回答已采纳

2回答

VirtualBox上Qt中的OpenMP仅使用一个线程

c++、multithreading、qt、openmp

我正在尝试使用OpenMP在VirtualBox上的QtCreator中并行化C++程序的一部分。主机系统采用四核cpu。由于我最初尝试使用openmp编译指示似乎不起作用(使用openmp的代码花费的时间几乎与不使用OpenMP的时间相同)，因此我回到OpenMP维基并尝试运行这个简单的示例。 int main(void) { #pragma omp parallel printf("Hello, world.\n"); return 0; } 输出结果就是 'Hello, world'. 我还试

浏览 1提问于2014-01-07得票数 3

1回答

双核ARMv7处理器中的并行处理

c、multithreading、performance、parallel-processing、neon

我正在开发Zedboard，它包含双核ARM A9处理器并运行Linux。该电路板与外部I/O设备通信。我有两个用“C”语言编写的函数，我必须并行运行。一个函数调用while循环，连续地将数据转储到外部设备，并将处理后的数据接收回内存指针。另一个函数从指针位置读取数据，创建它的副本，并执行计算密集型过程(如FFT、信号对齐等，这很慢)。外部设备需要每秒1500万个样本的数据。如果我只运行第一个函数，并且只需要一个ARM内核的70%，我就能够实现这一点。当我运行这两个函数时，两个ARM内核都达到了极限，并且我发现无法以所需的采样速度向外部设备提供数据。有没有一种方法可以将两个函数限制在

浏览 3提问于2018-06-09得票数 3