首页
学习
活动
专区
工具
TVP
发布

高性能计算

cuda、GPU、分布式、并行计算
专栏成员
6
文章
1072
阅读量
6
订阅数
【踩坑】探究PyTorch中创建稀疏矩阵的内存占用过大的问题
对于CUDA的内存问题,那就可以使用torch.cuda.memory_stats()来看他的内存使用情况:
小锋学长生活大爆炸
2024-07-15
930
【知识】一图看懂lstopo计算机硬件拓扑图及PCI相关知识简介
有一点需要特别注意:由于NVIDIA驱动会自动管理GPU参数,因此在空闲状态下,你看到的GPU对应的PCIe带宽是4GB/s。但实际上,当你在跑代码时候,驱动会自动把带宽拉上来,比如我下面这个图中,带宽就拉到了最高16GB/s。所以不要被迷惑了:
小锋学长生活大爆炸
2024-06-28
1520
【教程】设置GPU与CPU的核绑(亲和力Affinity)
简单来说,核绑,或者叫亲和力,就是将某个GPU与指定CPU核心进行绑定,从而尽可能提高效率。
小锋学长生活大爆炸
2024-06-28
1280
【知识】详细介绍 CUDA Samples 示例工程
CUDA 是“Compute Unified Device Architecture (计算统一设备架构)”的首字母缩写。CUDA 是一种用于并行计算的 NVIDIA 架构。使用图形处理器也可以提高 PC 的计算能力。
小锋学长生活大爆炸
2024-06-28
2660
【技巧】如何检查多个GPU之间是否支持P2P通信
需要用到cuda_samples:GitHub - NVIDIA/cuda-samples
小锋学长生活大爆炸
2024-06-28
2010
【教程】简介nccl-test工具
https://blog.csdn.net/sxf1061700625/article/details/127705588
小锋学长生活大爆炸
2024-06-28
2320
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档