在下面的文章中,我将使用openmpi v. 1.8.2和选项map-by core,以M字节/s格式给出三位一体测试的结果。源是使用包装器编译的。将基准测试的MPI通信器MPI_COMM_WORLD拆分为两个单独的。一个通信器将与实际运行基准测试的N进程组相关联,另一个通信程序将包含剩余的24-N进程,这些进程的目的只是为了保持内核的忙碌和防止涡轮增压。我还阅读了关于静态修饰符及其对基准测试的影响的讨论。我不确定是否真的有必要打电话给foo。
不幸的是,我的方法并没有导致与基准测试不同的结果。