关于内核的执行顺序有什么提示吗?
假设我开始处理1024x1024的网格,工作组为8x8。我有1080个计算单元,每个计算单元128个核心-总共2560个核心。
现在很明显,平均每个物理核心将在网格中平均处理大约400个项目。问统计上每个核心的执行顺序是什么?会是大排的吗?列主要或每个核心将有自己的“分区”来工作?
为了确保内存访问是高速缓存友好的,这个问题很重要。
https://stackoverflow.com/questions/50617580
相似问题