根据MPI标准,可以使用MPI_Cart_create例程的重新排序参数“以便选择将虚拟拓扑很好地嵌入到物理机器上”。但是,我无法找到在OpenMPI或MPICH中如何执行此操作的任何信息。有人能解释一下这种重新排序是如何发生的吗?如果它真的在任何MPI实现中提供了一个优化的虚拟拓扑的话?
发布于 2015-08-28 14:17:08
拓扑感知的通信器有很多方法可以提高性能,但在现实中,没有任何实现能够真正做到这一点(如Jeff在评论中所说)。
理论上,实现可以做一些事情,比如排列等级,以便物理拓扑中的进程(例如在相同的套接字/节点/齿条/等等中)。在军衔上也很接近。这将改善沟通时间,因为你会用较少的啤酒花来与最常与你沟通的队伍沟通。
https://stackoverflow.com/questions/32125267
复制相似问题