我很难使用OpenMP,特别是使用嵌套的for循环。我的应用程序包括每隔半秒钟将网格打印到屏幕上,但是当我用OpenMP并行它时,执行速度会慢10倍,或者根本不执行。parallel int y, x;
//#pragma ompparallel shared(grid) // garbage//#pragma ompparallel pri
所有这些例程都会造成一些开销,这可能大大限制了多处理的效率。考虑一个嵌套循环,内部循环被并行化: // some code which does not affect theexecution time noticeably for (int j = 0; j < inner_loops; j++) {// so