首页
学习
活动
专区
工具
TVP
发布

Fish

专栏作者
78
文章
118781
阅读量
35
订阅数
Kernelet: High-Throughput GPU Kernel Executions with Dynamic Slicing and Scheduling笔记
GPU需要大的kernel吞吐量来体现GPU的运算优势,但是以前的研究都是针对单个kernel的运行优化,但是单个kernel一般都无法充分利用GPU的资源。而现在的GPU调度都是一个kernel占据GPU然后运行完之后再进行下一个kernel的执行。因此论文提出了一些优化策略,主要思想就是kernel slicing。也就是将大的kernel通过分成较少的block的方式,让多个kernel能够并行执行,以提高GPU的利用率。
用户1148523
2019-05-29
4530
CUDA C最佳实践-CUDA Best Practices(一)
这文档堪称CUDA官方手册里最有用TOP3了。 ps:全文翻译会累死猿哒,意译意译,各位看官凑合一下啦 前言 文档的作用 这文档能干嘛,是用来帮助开发者从NVIDIA GPU上获取最好的性能的。建
用户1148523
2018-01-09
1.6K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档