我的内存块可能非常大(比L2缓存还要大),有时我必须将它们设置为全零。memset在串行代码中很好用,但是并行代码呢?有没有人有过从并发线程调用memset来加速大型数组的经验呢?或者甚至使用简单的openmp并行for循环?
发布于 2012-07-20 18:06:03
嗯,总是有L3缓存的……
然而,这很可能已经受到主存带宽的限制;增加更多的并行度不太可能改善情况。
https://stackoverflow.com/questions/11576670
相似问题