首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >CUDA或OpenCL内核中的执行顺序-用于内存访问优化

CUDA或OpenCL内核中的执行顺序-用于内存访问优化
EN

Stack Overflow用户
提问于 2018-05-31 13:58:02
回答 1查看 138关注 0票数 0

关于内核的执行顺序有什么提示吗?

假设我开始处理1024x1024的网格,工作组为8x8。我有1080个计算单元,每个计算单元128个核心-总共2560个核心。

现在很明显,平均每个物理核心将在网格中平均处理大约400个项目。问统计上每个核心的执行顺序是什么?会是大排的吗?列主要或每个核心将有自己的“分区”来工作?

为了确保内存访问是高速缓存友好的,这个问题很重要。

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50617580

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档