DSMC112 57360001-HC 空间和时间局部性受到负面影响
我们的分析表明,选择一种技术来并行化Gauss-Seidel内核并不总是最好的方法。例如,如果选择多级任务依赖图,在处理网格的最细级别时将暴露足够的并行性,但是在处理最粗级别时将不够,因此导致资源闲置。类似地,当使用块多色技术时,在多重网格的不同层次上保持相同的块大小和相同数量的颜色会损害并行性。
我们的分析还表明Gauss-Seidel内核的自动编译器矢量化能力很差。由于内存访问模式和元素间依赖的数量,这是意料之中的。事实上,Gauss-Seidel算法被证明由于其显式序列化而难以向量化。在块多色的情况下,块中的元素是顺序处理的,因此,连续节点之间的依赖性仍然存在。为了打破这些依赖性,可以通过交错元素来合并具有相同颜色的不同块。这样,块内的连续行不再相互依赖,因为具有相同颜色的不同块的两个给定元素不能相互依赖。至于多级任务依赖图,同一级别内的行已经不相互依赖。
ABB KUC755AE106
ABB 3BHB005243R0106
ABB PFTL101A 0.5KN 3BSE004160R1
ABB PFTL101A 0.5KN
ABB 3BSE004160R1
ABB RMU811
ABB RFO810
ABB CS31
ABB PFTL101B 2.0KN 3BSE004185R1
ABB PFTL101B 2.0KN
ABB 3BSE004185R1
ABB OCAHG 492838402
ABB OCAHG
ABB 492838402
ABB IDPG 940128102
ABB PP825 3BSE042240R1
ABB PP825
ABB 3BSE042240R1
ABB OCAH 940181103
ABB SCYC51090 58053899E
ABB SCYC51090
ABB 58053899E
ABB TP857 3BSE030192R1
ABB TP857
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。