腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Fish
专栏作者
举报
78
文章
118781
阅读量
35
订阅数
订阅专栏
申请加入专栏
全部文章(78)
编程算法(18)
android(9)
深度学习(9)
打包(8)
机器学习(6)
ubuntu(5)
spark(5)
https(5)
其他(4)
数据库(4)
http(4)
存储(4)
tensorflow(3)
java(3)
bash(3)
单片机(3)
ide(3)
linux(3)
apt-get(3)
人工智能(3)
网络安全(3)
hadoop(3)
uml(3)
c++(2)
python(2)
bash 指令(2)
容器镜像服务(2)
容器(2)
分布式(2)
缓存(2)
kernel(2)
gcc(2)
大数据(2)
数据处理(2)
ps(2)
objective-c(1)
.net(1)
scala(1)
node.js(1)
typescript(1)
opengl(1)
arm(1)
eclipse(1)
api(1)
神经网络(1)
腾讯云测试服务(1)
渲染(1)
sass(1)
开源(1)
爬虫(1)
numpy(1)
opencv(1)
unity(1)
二叉树(1)
markdown(1)
微信(1)
cin(1)
eof(1)
gpu(1)
ontouchlistener(1)
stl(1)
vector(1)
链表(1)
内存(1)
软件(1)
事件(1)
指针(1)
搜索文章
搜索
搜索
关闭
Kernelet: High-Throughput GPU Kernel Executions with Dynamic Slicing and Scheduling笔记
kernel
编程算法
GPU需要大的kernel吞吐量来体现GPU的运算优势,但是以前的研究都是针对单个kernel的运行优化,但是单个kernel一般都无法充分利用GPU的资源。而现在的GPU调度都是一个kernel占据GPU然后运行完之后再进行下一个kernel的执行。因此论文提出了一些优化策略,主要思想就是kernel slicing。也就是将大的kernel通过分成较少的block的方式,让多个kernel能够并行执行,以提高GPU的利用率。
用户1148523
2019-05-29
453
0
CUDA C最佳实践-CUDA Best Practices(一)
深度学习
ide
腾讯云测试服务
kernel
node.js
这文档堪称CUDA官方手册里最有用TOP3了。 ps:全文翻译会累死猿哒,意译意译,各位看官凑合一下啦 前言 文档的作用 这文档能干嘛,是用来帮助开发者从NVIDIA GPU上获取最好的性能的。建
用户1148523
2018-01-09
1.6K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档