腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
方亮
无聊时玩的各种技术
专栏成员
举报
387
文章
397168
阅读量
36
订阅数
订阅专栏
申请加入专栏
全部文章(387)
编程算法(82)
c++(40)
基础(36)
研发(36)
数据(35)
kubernetes(34)
工程师(34)
windows(27)
数据库(26)
http(23)
打包(20)
框架(16)
系统(16)
容器(15)
开源(15)
numpy(15)
数组(15)
配置(14)
mybatis(11)
image(11)
服务(11)
函数(11)
编译(10)
部署(10)
java(9)
存储(9)
data(9)
云数据库 Redis(8)
ide(8)
网络安全(8)
import(8)
string(8)
python(7)
nginx(7)
time(7)
测试(7)
对象(7)
php(6)
linux(6)
数据分析(6)
数据处理(6)
clickhouse(6)
io(6)
png(6)
types(6)
事件(6)
sql(5)
api(5)
apache(5)
deployment(5)
instrumentation(5)
signals(5)
操作系统(5)
脚本(5)
镜像(5)
lua(4)
html(4)
access(4)
ubuntu(4)
文件存储(4)
腾讯云测试服务(4)
分布式(4)
https(4)
dll(4)
include(4)
scipy(4)
self(4)
trace(4)
version(4)
序列化(4)
其他(3)
c 语言(3)
go(3)
bash(3)
react(3)
xml(3)
maven(3)
大数据处理套件 TBDS(3)
推荐系统(3)
单元测试(3)
架构设计(3)
kafka(3)
code(3)
container(3)
count(3)
local(3)
protobuf(3)
sh(3)
storage(3)
word(3)
程序(3)
工作(3)
后端(3)
接口(3)
进程(3)
内存(3)
设计(3)
算法(3)
统计(3)
网络(3)
源码(3)
c#(2)
node.js(2)
android(2)
汇编语言(2)
postgresql(2)
windows server(2)
深度学习(2)
访问管理(2)
域名注册(2)
混合云存储(2)
serverless(2)
缓存(2)
爬虫(2)
shell(2)
正则表达式(2)
zookeeper(2)
数据结构(2)
系统架构(2)
sdk(2)
验证码(2)
class(2)
cpu(2)
exe(2)
filter(2)
grpc(2)
it(2)
metrics(2)
mysql(2)
plugin(2)
row(2)
service(2)
size(2)
table(2)
编程(2)
遍历(2)
定时任务(2)
二进制(2)
工具(2)
集合(2)
监控(2)
浏览器(2)
流量(2)
软件(2)
同步(2)
区块链(1)
javascript(1)
.net(1)
bootstrap(1)
css(1)
json(1)
listview(1)
云数据库 SQL Server(1)
git(1)
github(1)
jar(1)
容器镜像服务(1)
GPU 云服务器(1)
日志服务(1)
数据库一体机 TData(1)
文字识别(1)
视频处理(1)
图像处理(1)
网站(1)
url 安全(1)
自动化(1)
hadoop(1)
gui(1)
面向对象编程(1)
npm(1)
tcp/ip(1)
rpc(1)
udp(1)
kernel(1)
gcc(1)
模式识别(1)
socket编程(1)
大数据(1)
小程序(1)
notepad ++(1)
任务调度(1)
sdn(1)
迁移(1)
action(1)
adapter(1)
add(1)
admin(1)
aws(1)
axis(1)
backend(1)
bit(1)
build(1)
components(1)
config(1)
copy(1)
dashboard(1)
default(1)
dockerfile(1)
dos(1)
dot(1)
event(1)
execute(1)
field(1)
file(1)
flags(1)
focus(1)
func(1)
function(1)
google(1)
goto(1)
grid(1)
handle(1)
init(1)
ip(1)
kubectl(1)
layer(1)
ld(1)
libraries(1)
list(1)
map(1)
max(1)
md5(1)
min(1)
mock(1)
msdn(1)
pool(1)
projection(1)
prometheus(1)
public(1)
range(1)
redis(1)
reduce(1)
reshape(1)
return(1)
rocketmq(1)
router(1)
sampling(1)
server(1)
sleep(1)
stream(1)
sys(1)
uuid(1)
watermark(1)
web(1)
window(1)
worker(1)
yaml(1)
zero(1)
百度(1)
编程语言(1)
编译器(1)
博客(1)
产品(1)
登录(1)
定时器(1)
反射(1)
分布式系统(1)
服务器(1)
管理(1)
继承(1)
解决方案(1)
客户端(1)
连接(1)
量化(1)
路由(1)
论文(1)
模型(1)
排序(1)
日志(1)
软件工程(1)
生命周期(1)
数据类型(1)
搜索(1)
推送(1)
线程(1)
性能监控(1)
虚拟机(1)
异步(1)
异常(1)
优化(1)
装饰器(1)
代码分析工具(1)
搜索文章
搜索
搜索
关闭
并行计算——OpenMP加速矩阵相乘
深度学习
java
腾讯云测试服务
OpenMP是一套基于共享内存方式的多线程并发编程库。第一次接触它大概在半年前,也就是研究cuda编程的那段时间。OpenMP产生的线程运行于CPU上,这和cuda不同。由于GPU的cuda核心非常多,可以进行大量的并行计算,所以我们更多的谈论的是GPU并行计算(参见拙文《浅析GPU计算——CPU和GPU的选择》和《浅析GPU计算——cuda编程》)。本文我们将尝试使用OpenMP将CPU资源榨干,以加速计算。(转载请指明出于breaksoftware的csdn博客)
方亮
2019-01-16
2.8K
0
浅析GPU计算——CPU和GPU的选择
深度学习
缓存
html
https
http
目前市面上介绍GPU编程的博文很多,其中很多都是照章宣科,让人只能感受到冷冷的技术,而缺乏知识的温度。所以我希望能写出一篇可以体现技术脉络感的文章,让读者可以比较容易理解该技术,并可以感悟到cuda编程设计及优化的原理。(转载请指明出于breaksoftware的csdn博客)
方亮
2019-01-16
2.2K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档