使用openMP并行填充直方图_如何使用openmp并行biginteger？_使用Openmp并行化c程序 - 腾讯云开发者社区

c++、optimization、pthreads、parallel-processing、openmp

我正在工作的代码，比较图像直方图，购买计算相关性，交集，ChiSquare和其他一些方法。这些函数的总体外观彼此非常相似。通常我使用pthread，但这次我决定用openMP构建小的原型(由于它的简单性)，看看我会得到什么结果。这是通过相关性进行比较的示例，代码与串行实现相同，但openMP循环的单行除外。 double comp(CHistogram* h1, CHistogram* h2){ double Sa = 0; double Sb = 0; double Saa = 0; double Sbb = 0; double Sab = 0;

浏览 1提问于2011-07-31得票数 3

1回答

与OpenMP并行填充直方图(数组约简)，而不使用关键部分

openmp、histogram

我想使用OpenMP并行填充直方图。我用C/C++中的OpenMP提出了两种不同的方法。第一种方法proccess_data_v1为每个线程创建一个私有直方图变量hist_private，以并行方式填充它们，然后将私有直方图合并到critical部分中的共享直方图hist中。第二种方法proccess_data_v2使数组大小等于线程数的直方图共享数组，并行填充该数组，然后并行地对共享直方图hist进行求和。第二种方法似乎优于我，因为它避免了一个关键的部分，并与直方图并行求和。但是，它需要知道线程数并调用omp_get_thread_num()。我一般都尽量避免这样做。是否有更好的方法不

浏览 2提问于2013-05-28得票数 13

回答已采纳

1回答

多个节点上的C++ OpenMP

c++、openmp

我有个问题..。我知道在一台计算机上运行多核的OpenMP，但是OpenMP能像两台机器一样运行在几个节点上吗？或者我一定要使用MPI吗？我知道OpenMP有共享内存架构，而MPI是分布式内存架构，所以我的假设是正确的吗? OpenMP只能在一台机器上工作。

浏览 5提问于2014-08-09得票数 3

2回答

#语用omp并行与#实用化omp并行的区别

c++、c、multithreading、parallel-processing、openmp

我是OpenMP新手，我一直在尝试运行一个程序，该程序使用OpenMP添加两个数组。在OpenMP教程中，我了解到我们需要为使用#务实omp并行，而在for循环中使用OpenMP。但是我也尝试过在#实用化omp并行中使用同样的方法，它也给了我正确的输出。下面是我试图传达的代码片段。 #pragma omp parallel for { for(int i=0;i<n;i++) { c[i]=a[i]+b[i]; } } 和 #pragma omp parallel { for(int i=0;i<n;

浏览 5提问于2020-12-11得票数 2

回答已采纳

1回答

OpenMP -使用并行管理多个调用以阻止

c++、multithreading、openmp

假设我有一个程序，它有一个名为run()的函数，这个函数将执行一个for loop，并在其中执行一些工作。因为我想利用我所有的CPU核心，所以我使用带有#pragma omp parallel for的OpenMP来并行化它。现在，问题是这个run()函数是从多个线程调用的，当有大量线程同时调用run()时，我会有巨大的性能损失，因为每个parallel for杂注调用都会有大量的OpenMP threads。为了说明，我有线程A和线程B，我的CPU有4个核心，线程A调用函数run()，它将创建4个OpenMP线程来运行for loop。现在，同时，线程B还调用run()，这将生成更多

浏览 0提问于2017-11-09得票数 0

1回答

OpenMP、随机变量和可重复性

r、openmp、reproducible-research

我正在写一个R代码，它调用C++，C++函数使用了大量基于openMP的并行计算。这是我使用openMP的第一个代码，我看到的是，即使设置相同的C++随机种子，代码也不会给出相同的结果。我在这里读了很多帖子，似乎这是openMP的问题，但它们都是旧的(between12到5年前)我想知道现在是否有解决方案，是否有已发表的文章解释这个问题或/和可能的解决方案。谢谢

浏览 4提问于2020-10-12得票数 0

1回答

使用OpenMP填充大型数组

c++、c++11、random、openmp

我想创建一个大小为(10^7)的一维数组，并随机填充它。是否可以创建多个10个数组，每个数组大小为10^6，随机填充它们，然后使用OpenMP将它们合并为一个数组？ std::random_device rd{}; std::mt19937 rng{rd()}; std::bernoulli_distribution distribution(p); int array_size = 10000000, N = 50; array = new uint64_t[array_size]; #pragma omp parallel { #pragma omp parallel for

浏览 2提问于2019-06-29得票数 0

1回答

超级计算机上的OpenMP

c++、mpi、openmp

在本地集群上，我可以使用这个脚本在36个核心上并行我的OpenMP代码 #$ -S /bin/bash #$ -N name_of_project #$ -o output.out #$ -pe orte 36 #$ -V #$ -cwd export OMP_NUM_THREADS=36 ./my_programme 我可以在有4个节点的36个核心上运行OpenMP c++代码. 然而，在作为XSEDE一部分的超级计算设施上：我被告知，我只能在有16个核心的一个节点上运行OpenMP。我有点困惑，所以如果我想用超过17个线程并行化我的程序，我必须将我的程序重新编码成MPI程序吗？我想

浏览 4提问于2015-09-04得票数 0

回答已采纳

2回答

omp_get_max_threads()在并行区返回1，但应为8

c++、multithreading、openmp

我正在Linux上编译一个复杂的C++项目，它使用OpenMP，用CMake和GCC 7编译。我在这个项目中遇到的奇怪问题是OpenMP显然可以工作，但它认为只支持1个线程，而它应该是8个线程。但是，如果我手动指定线程的数量，它确实会加速代码。 logOut << "In parallel? " << omp_in_parallel() << std::endl; logOut << "Num threads = " << omp_get_num_threads() << std::endl

浏览 1提问于2017-08-03得票数 1

1回答

如何在图形工具包中用OpenMP并行运行SBM算法？

python、openmp、graph-tool

我一直在使用在中实现的。我需要处理大量的数据，并且需要并行运行。我知道OpenMP在这个包中默认是激活的，并在特定的兼容算法中使用，但文档没有指定是哪种算法。我试过openmp_enabled()或openmp_set_num_threads()，也试过export OMP_NUM_THREADS=16。一切似乎都很好，但当我检查正在运行的进程时，它并不是并行的。你有实现SBM并行化的经验吗？

浏览 5提问于2020-12-03得票数 2

1回答

OpenMP:并行程序，不是更快(或者不是很快)，然后是串行程序。我做错了什么？

c、performance、gcc、openmp

看看这段代码： #include <stdio.h> #include <omp.h> int main() { long i, j; #pragma omp for for(i=0;i<=100000;i++) { for(j=0;j<=100000;j++) { if((i ^ j) == 5687) { //printf("%ld ^ %ld\n", i, j);

浏览 1提问于2012-04-10得票数 1

2回答

OpenMP中用于进程间通信的线程

multithreading、parallel-processing、openmp

我有一个OpenMP并行化的程序，看起来像这样： [...] #pragma omp parallel { //initialize threads #pragma omp for for(...) { //Work is done here } } 现在我添加了MPI支持。我需要的是一个处理通信的线程，在我的例子中，它总是调用GatherAll并填充/清空一个链表，以便从其他进程接收/发送数据。该线程应该发送/接收，直到设置了标志。所以现在在这个例子中没有MPI的东西，我的问题是关于在OpenMP中实现这个例程。我如何实现这样的线程？例如，我尝试在这里引入一条指令： [..

浏览 0提问于2012-03-13得票数 2

回答已采纳

4回答

理解OpenMP在叉子方面的缺陷

c、openmp

，我想理解他们在这里的意思。为什么这个程序“挂起”？来自 OpenMP和fork()值得一提的是，在调用fork()的程序中使用OpenMP需要特别考虑。这个问题只影响GCC，国际刑事法院不受影响。如果您的程序打算成为一个使用daemonize()或其他类似方式的后台进程，则不能在分叉之前使用OpenMP特性。在使用OpenMP特性之后，只有当子进程不使用OpenMP特性时，或者作为一个全新的进程(例如exec()之后)，才允许使用分叉。这是一个错误程序的例子： # <stdio.h> #include <sys/war.h># <unistd.h>

浏览 0提问于2018-03-01得票数 8

回答已采纳

4回答

英特尔i7上的OpenMP

openmp

我在i7 CPU中的openMP有一个问题。我使用openMP只是为了并行化一个“for”循环。算法在几台不同的PC上运行，没有任何问题。最近，我们尝试在i7系统上运行它，但遇到了一个问题。软件通常会运行一段时间，在几个周期后，它报告“内存不足”，我们试图找到内存泄漏，但我们发现软件使用的堆栈大小太大-有很多1Mb线程没有关闭。不知何故，由openMP创建的线程都卡在堆栈中，内存中充满了它们。有没有人经历过这样的行为？代码非常简单，只是一个‘杂注omp并行’与一些周期，这工作在其他PC的。我正在使用带有内置openMP库的Microsoft Visual C++ 9.0编译器。谢谢你，

浏览 1提问于2009-08-27得票数 2

1回答

我们可以在最新版本的openCV上使用OpenMP吗

visual-c++、opencv、parallel-processing、openmp

我想使用openMP并行化我的图像处理代码。我怀疑最新版本的OpenCV是否支持OpenMP，比如2.4.4或2.4.5版本。我知道TBB，但看起来太复杂了。

浏览 1提问于2013-05-16得票数 0

1回答

当涉及到GPGPU时，OpenMP与OpenCL有什么不同？

opencl、openmp、distributed-computing

当程序在GPGPU上运行时，如果用OpenMP和OpenCL实现，它的执行会有什么不同？ OpenMP是否通过OpenCL使用GPGPU？如果不是，我可以直接使用的通用GPGPU是什么(没有构建在上面的任何OpenMP/OpenCL )？在Linux上，OpenMP只使用线程来管理线程。除了OpenCL和CUDA之外，我找不到GPGPU的其他API，所以很明显(但相当痛苦)，OpenMP在GPGPU上使用OpenCL (如果GPGPU是NVIDIA的，OpenMP是那么聪明的话)。

浏览 2提问于2016-03-06得票数 2

1回答

为什么分支进入或离开并行区域是非法的？

openmp

我刚刚开始学习使用OpenMP和进行并行编程。在那里，在许多地方，规定分支进入或离开并行区域是非法的，但我至少不知道为什么。如果有人能解释为什么会这样，那对熟悉OpenMP将会很有帮助。谢谢!

浏览 1提问于2013-07-01得票数 1

回答已采纳

5回答

我可以在C++11中安全地使用OpenMP吗？

c++、c++11、openmp

OpenMP标准只考虑ISO98( C++ 14882:1998)。这意味着在C++03甚至C++11下没有支持OpenMP用法的标准。因此，任何使用C++ >98和OpenMP的程序都在标准之外运行，这意味着即使它在某些条件下工作，它也不太可能是可移植的，但绝对不能保证。对于具有自己的多线程支持的C++11，情况甚至更糟，这很可能会在某些实现中与OpenMP发生冲突。那么，在C++03和C++11中使用OpenMP有多安全呢？可以在同一个程序中安全地使用C++11多线程和OpenMP，但不会交错(即在任何传递给C++11并发特性的代码中没有OpenMP语句，在OpenMP产生的线

浏览 1提问于2012-12-12得票数 44

回答已采纳

2回答

简单的openmp调用for循环不起作用

openmp

我正在写一些代码，这将肯定受益于试图集成openmp的一些软件，我正在编写。我是openmp的新手，在测试一些非常基本的测试代码时(见下文)，我注意到在激活openmp的情况下执行时间非常长(#杂注行)。任何洞察力都是非常值得欣赏的。 int main() { int number=200; int max = 2000000; for(int t=1; t<max; t++) { double fac = 0.0; #pragma omp parallel for reduction(+:fac) for(int n=

浏览 1提问于2014-07-05得票数 0

1回答

如何安装LightGBM？在Mac中找不到OpenMP_C的错误

gcc、cmake、lightgbm

我正在使用Mac os并安装Lightgbm。 pip uninstall lightgbm git clone --recursive https://github.com/Microsoft/LightGBM ; cd LightGBM export CXX=g++-8 CC=gcc-8 mkdir build ; cd build cmake .. make -j4 我不能安装gcc@8，gcc@7等等，所以我尝试了brew install gcc，它成功了。但是cmake ..失败了。错误信息： Could NOT find OpenMP_C (missing: OpenM

浏览 26提问于2022-06-10得票数 0

1回答

使用其他几个非OpenMP源文件编译和运行单个OpenMP源文件

fortran、openmp、fortran90

我正在尝试编译多个FORTRAN源文件，其中我对其中一个源文件应用了一些OpenMP指令。例如：编译标志： COMPILE00='ifort -O3 -openmp -openmp_report -fpconstant -fp-model precise -fpe0 -traceback -ftrapuv' COMPILE0='ifort -O3 -fpconstant -fp-model precise -fpe0 -traceback -ftrapuv' 编译后的文件： $COMPILE0 -c microprm.F90 modules.F90 $COM

浏览 1提问于2014-06-22得票数 1

1回答

用ISPC编译器编写OpenMP程序

c++、c、performance、openmp、intel

能否用ISPC编译器编译OpenMP程序？如果是，性能是否比和gcc一起编译更多？如何利用ISPC和OpenMP的优点？

浏览 3提问于2013-07-23得票数 2

3回答

在GNU OpenMP中有没有结束空闲线程的方法？

openmp

我在程序开始时使用OpenMP进行并行排序。数据加载和排序后，程序将作为守护进程运行，不再使用OpenMP。有没有办法关闭OpenMP创建的空闲线程？omp_set_num_threads()不会影响已经为任务创建的空闲线程。

浏览 9提问于2015-02-09得票数 1

1回答

我可以让OpenMP在使用omp_set_num_threads之后恢复到理想的线程#吗？

c++、openmp

是否有一种方法使OpenMP将线程数(下次使用时)恢复到默认的之后，应用程序已经用一个特定的编号调用了omp_set_num_threads()？例如，是否有一个特殊的代码(例如0或-1)我提供给omp_set_num_threads？还是我应该试着做一些像omp_set_num_threads(omp_get_max_threads())这样的事情我假设默认的数字是OpenMP的实现认为“最优”的任何东西。但我不知道，如果有的话，默认是什么，甚至应该是什么。我所知道的是，我有一个应用程序，它为一个特定的omp_set_num_threads(4)块调用OpenMP，我现在不能编辑这个块

浏览 0提问于2019-07-10得票数 2

回答已采纳

4回答

核心上循环的OpenMP分割

c++、openmp

我正在尝试使用sse指令和openmp并行执行一些应用程序。关于openmp部分，我有如下代码： for(r=0; r<end_condition; r++){ .. several nested for loops inside .. } 我想将这个循环划分到多个内核的r上，例如，当使用两个内核时，一个内核应该执行r=0。r=end_condition/2-1，另一个r=end_condition/2.r=end_condition-1。循环的迭代之间没有通信，因此它们可以并行运行，在r循环结束时，结果应该是同步的。如何使用openmp指令以这种方式将其分配到内核？我必须在r

浏览 0提问于2011-11-29得票数 2

2回答

为什么openmp 32线程比1线程慢得多？

c、multithreading、parallel-processing、mpi、openmp

我正在编写一个计算两个数组的l2范数的应用程序。我不得不并行我的计算。下面是我并行化的代码： double time_start_openmp = omp_get_wtime(); #pragma omp parallel for for (i = 0; i < n; i++) { numberOfThreads = omp_get_num_threads(); double local_diff = x[i] - xseq[i]; diff_vector[i] = local_diff; l2_norm += (

浏览 0提问于2020-12-16得票数 1

回答已采纳

1回答

OpenMp到Pthreads文件

gcc、pthreads、openmp

要知道pthread对openmp指令的调用，需要使用哪些gcc命令行语句？我知道在汇编，简单，rtl，树中生成IR文件的-fdump命令行语句。但是我无法为openmp指令获取任何pthread转储。

浏览 1提问于2014-10-20得票数 0

1回答

OpenMP嵌套循环，每个“loop”循环之间有代码

c++、openmp、nested-loops

出于某些原因，我必须在嵌套循环中的每个for语句之间放置一些代码，如下所示： for (int i = 0; i < n; ++i) { //i have to put some code here do something_1 for (int j = 0; j < n; ++j) { //i have to put some code here do something_2 for (int k = 0; k < n; ++k) { do something_3

浏览 0提问于2016-06-17得票数 0

1回答

为什么OpenMP不能在for循环中有节？

openmp

我正在尝试在OpenMP中并行化一个基于范围的for循环，方法是使循环的每次迭代都成为一个OpenMP段。我想这样做： #pragma omp parallel sections { for ( auto x : range ) { #pragma omp section // LOTS OF CODE HERE } } 然而，这并不起作用--编译器抱怨这个节必须在#杂注omp节构造中。是我做错了什么，还是OpenMP不够聪明，不能理解这一部分在for循环中？

浏览 9提问于2017-12-21得票数 3

回答已采纳

2回答

C# HPC - MPI和OpenMP

c#-4.0、mono、parallel-processing、mpi、openmp

我正在寻找一些关于C#和并行编程的指导。我知道MPI .NET存在，不支持OpenMP。我的问题是:有没有其他的库(TPL?)或者可以完成OpenMP提供的功能的功能？我会工作的(希望如此！)使用最新版本的mono (C# .NET 4.0)。代码将在Cray XT6M上运行，因此在每个板和一个节点上利用一个资源将是重要的。耽误您时间，实在对不起!

浏览 4提问于2012-01-27得票数 6

1回答

跨函数的OpenMP线程组的持久性

c、gcc、openmp

我有一个简单的程序，我正在使用的物理模拟。我想知道如何在OpenMP中实现特定的线程范例。 int main() { #define steps (100000) for (int t = 0;t < steps; t++) { firstParallelLoop(); secondParallelLoop(); if (!(t%100)) { checkpoint(); } } } void firstParallelLoop() {// In another file.c #pragma omp

浏览 0提问于2012-09-27得票数 3

回答已采纳

2回答

OpenMP创建了太多的线程

c++、openmp

我不知道为什么OpenMP使用这么多线程。它似乎与Microsoft实现无关，因为我也尝试过显示相同行为的Intel库。我的代码中有一些并行部分，它们是计算范围的，不应该创建和使用比内核更多的线程。但我所观察到的是，对于n个启动线程，OpenMP会创建n*核线程。在我看来这是个大漏线。如果我在服务器上执行一个“小”32位应用程序，它可能会失败，因为1000个OpenMP线程已经需要2GB的地址空间，没有给应用程序留下任何内存。这种情况不应该发生。我希望从最先进的线程池中重用它的线程，并删除不再使用的线程。我尝试使用omp_set_num_threads(8)将线程池大小限制为8个内核，但这

浏览 3提问于2016-05-23得票数 3

回答已采纳

4回答

OpenMP开销

openmp、tbb

我已经使用OpenMP和Intel TBB并行化了图像卷积和lu分解。我正在1-8个内核上测试它。但是，当我通过分别使用set_num_threads(1)和task_scheduler_init InitTBB(1)指定一个线程，在OPenMP和TBB中的1核上进行测试时，由于TBB开销，TBB性能与顺序代码相比略有下降，但令人惊讶的是，OpenMP在单核上没有显示任何开销，并且性能与顺序代码完全相同(使用英特尔O3优化级别)。我使用的是OpenMP循环的静态调度。这是现实的，还是我做错了什么？

浏览 0提问于2011-09-05得票数 2

7回答

OpenMP和Python

python、parallel-processing、openmp

我有为共享内存机器(在C和FORTRAN中)编写OpenMP代码以执行矩阵加法、乘法等简单任务的经验(看看它是如何与LAPACK竞争的)。我对OpenMP有足够的了解，可以执行简单的任务，而不需要查看文档。最近，我转到Python进行我的项目，除了绝对的基础之外，我对Python没有任何经验。我的问题是：在Python中使用OpenMP最简单的方法是什么？最简单的，我指的是在程序员方面花费最少的精力(即使它是以增加系统时间为代价的)？我之所以使用OpenMP，是因为串行代码可以转换成一个工作的并行代码，其中分散着几个!$OMP代码。实现粗略并行化所需的时间少得惊人。有没有办法在Pyth

浏览 22提问于2012-07-06得票数 82

回答已采纳

2回答

如果堆栈中较低的函数已经引发并行计算，则忽略并行计算请求。

multithreading、openmp

在OpenMP中，当一个函数在堆栈中越低，就会引发多处理，那么OpenMP设备会忽略来自函数体的多处理请求，在堆栈中越高越好吗？这就是OpenMP一贯的工作方式吗？如果没有，我可以这么做吗？多么? void do1() { #pragma omp parallel for for (unsigned int i = 0; i < 10; ++i); } void do2() { #pragma omp parallel for for (unsigned int i = 0; i < 10; ++i) do1(); } void do3() {

浏览 6提问于2022-06-12得票数 1

回答已采纳

1回答

OpenMP能在MFC应用程序中工作吗？

c++、mfc、openmp

我想通过并行处理来提高我们的MFC应用程序的性能。当然，我在互联网上搜索过OpenMP和MFC。大多数帖子都是关于将OpenMP集成到MFC应用程序中的挣扎。引出了这个问题。是否可以将OpenMP用于MFC应用程序？更新:看起来可以做OpenMP为MFC所做的事情。但我还是想确认一下上面的问题。

浏览 2提问于2011-12-19得票数 1

回答已采纳

6回答

并行化:pthread还是OpenMP？

multithreading、optimization、pthreads、openmp

在科学计算领域，当涉及到共享内存并行化时，大多数人使用OpenMP作为准标准。有没有什么理由(除了可读性之外)在pthread上使用OpenMP？后者似乎更基础，我怀疑它可以更快、更容易优化。

浏览 0提问于2009-06-01得票数 44

回答已采纳

3回答

OpenMP并行尖峰

c++、multithreading、performance、parallel-processing、openmp

我正在使用Visual Studio2010中的OpenMP来加速循环。我写了一个非常简单的测试来看看使用OpenMP的性能提升。我在一个空循环上使用omp并行 int time_before = clock(); #pragma omp parallel for for(i = 0; i < 4; i++){ } int time_after = clock(); std::cout << "time elapsed: " << (time_after - time_before) << " milliseconds

浏览 1提问于2014-06-29得票数 0

1回答

与串行版本相比，插入排序与openMP并行化得到了非常显著的结果。

c++、multithreading、sorting、parallel-processing、openmp

上下文你好! 我对POSIX线程和OpenMP的体验有了一点微乎其微的了解，试图将两者与插入排序的串行实现进行比较，看看哪种输入在哪种输入上表现良好。至少可以说，我得到的结果很奇怪。也许是因为我的代码有问题。我要说的是，由于它是一个非常糟糕的实现，所以我的p线程实现肯定是，而且需要做更多的工作。然而，看看OpenMP和Serial所花的时间，我看到了非常奇怪的趋势。代码在我向您展示我所用时间的图表之前，下面是每个代码。对序列来说， static inline void * insertionSort(void *arrayMetaDataToUnpack) { // UNP

浏览 2提问于2020-09-17得票数 1

2回答

MPI和OpenMP有什么不同？

mpi、openmp、difference

我想知道(简而言之) OpenMP和MPI之间的主要区别是什么。

浏览 1提问于2015-09-09得票数 67

回答已采纳

1回答

STL并行执行与OpenMP性能

c++、stl、openmp

我正在启动一个新项目，并希望并行化一些计算。我以前使用过OpenMP，但我知道现在很多STL算法都可以直接并行化。由于这两种方法都遵循不同的范例(例如原始循环与迭代器和匿名函数)，所以我想先选择一种。哪种方法更快？为了测试这一点，我对以下C++20代码进行了基准测试： #include <algorithm> #include <iostream> #include <vector> #include <numeric> #include <cmath> #include <chrono> #include <e

浏览 6提问于2021-08-27得票数 4

1回答

使用OpenMP的阻塞函数

c++、multithreading、openmp

我有一个GUI应用程序，它侦听来自第二个线程的网络端口。我在看OpenMP，我想知道有没有像这样创建线程的简单方法。我在搜索文档，但是OpenMP站点导航起来不是很方便。有人能帮帮忙吗？

浏览 3提问于2009-05-27得票数 2

回答已采纳

2回答

OpenMP与矢量化的比较

openmp、vectorization

给定一个示例函数(下面给出示例)，for循环可以使用OpenMP并行化，也可以使用向量化(假设编译器执行向量化)进行向量化。示例 void function(float* a, float* b, float* c, int n) { for(int i = 0; i < n; i++) { c[i] = a[i] * b[i]; } } 我想知道 VectorizationIs和是否会在性能上有任何差异？是否有可能同时使用OpenMP和矢量化。注意:我没有给出关于SSE的不同版本，处理器/核的数量(随着OpenMP中的线程数的

浏览 3提问于2012-05-09得票数 2

回答已采纳

2回答

OpenMP共享数据

c++、openmp、shared

我对OpenMP有点陌生，但一般都有并行处理方面的经验。我以前和boost::threads合作过，现在我正在用openmp进行测试。问题是，我不知道如何处理共享数据访问，因为我不知道openmp在并行循环内部对共享数据对象做了什么。我现在正在做的事情(到目前为止还在起作用)：我用mmap将文件从磁盘读入内存。在内存映射部分之后，我收到char上的指针。 OpenMP现在可以在OpenMP并行循环中使用这个指针，并在线程之间共享数据。现在，我可以在映射和共享文件中搜索正则表达式匹配，多个线程根据(相当长的)正则表达式列表检查每个字符串。我使这个列表(包含regex的向量)在openmp循

浏览 0提问于2011-05-10得票数 3

2回答

为OpenMP函数创建别名||部分禁用openMP

c++、multithreading、openmp、preprocessor-directive

是否可以为openMP名称创建预处理别名？即 #define #myParallel #pragma omp parallel for #define #myBarrier #pragma omp barrier 为了…目的 #ifdef MY_LIB_DISABLE_OPENMP #define #myParallel #define #myBarrier #else #define #myParallel #pragma omp parallel for #define #myBarrier #pragma omp barrier #endif 我有两个库，都使用openmp。

浏览 0提问于2018-03-25得票数 1

2回答

使用OpenMP的工作量有多大开始变得有意义？

c++、performance、openmp

我最近开始研究使用OpenMP的并行化，并找到了大量描述如何使用它的好资源。然而，我找不到关于并行化何时开始有意义的文档，或者换句话说:在哪里是并行化开始补偿OpenMP线程创建开销的转折点，在什么情况下没有它会更好？工作有多复杂才有意义将其并行化？有没有关于这方面的文档或指南？

浏览 0提问于2013-03-23得票数 0

1回答

OpenMP的哪个线程做的工作最多？

multithreading、performance、parallel-processing、openmp

我想测量每个线程在OpenMP中执行任务的时间。我怎么能这么做？

浏览 2提问于2021-03-16得票数 1

回答已采纳

1回答

单线程的openmp与无openmp的比较

openmp

在使用OpenMP进行多线程处理的代码中，如果线程数设置为一个，那么在添加OpenMP或删除所有OpenMP内容之前，代码的时间性能是否与串行代码相同或非常相似？

浏览 5提问于2014-04-08得票数 3

回答已采纳

1回答

混合分布式和共享内存的混合OpenMP + OpenMPI？

parallel-processing、openmp、openmpi

根据我的标准，我正在开发一个代码来执行一些非常大的计算。基于单CPU的估计，预期运行时间约为10年，内存需求约为64 GB。几乎不需要IO。我正在讨论的代码的串行版本(用C编写)工作得足够好，我必须开始考虑如何最好地并行化代码。我可以访问具有大约64 GB RAM和每个节点16个核心的集群。我可能会限制自己使用例如<= 8节点。我正在设想这样一种设置:在单个节点上的线程之间共享内存，在不同的节点上使用单独的内存，并且节点之间的通信相对较少。到目前为止，根据我所读到的内容，我提出的解决方案是使用混合的OpenMP + OpenMPI设计，使用OpenMP管理各个计算节点上的线程，使用O

浏览 0提问于2012-09-08得票数 4

回答已采纳