首页
学习
活动
专区
圈层
工具
发布

#cuda

使用NVIDIA CUDA Tile编写高性能矩阵乘法

用户11764306

本文是帮助开发者学习NVIDIA CUDA Tile编程以构建高性能GPU核函数系列文章的一部分,以矩阵乘法作为核心示例。

7210

Jim Keller:英伟达“CUDA护城河”将终结?

芯智讯

12月9日消息,英伟达近日正式发布了“NVIDIA CUDA Toolkit 13.1”,其中“CUDA Tile”是最核心的更新,这是英伟达基于 Tile 的...

13910

为更好与英伟达CUDA竞争,华为CANN全面开源

芯智讯

8月5日,在北京召开的昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为CANN Mind系列应用套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,...

11810

英伟达N1X细节曝光:20核CPU、6144个CUDA计算单元

芯智讯

7月27日消息,人工智能芯片大厂英伟达(NVIDIA)与联发科合作的首款 Windows on Arm PC处理器N1X的更多细节信息被曝光,其集成的GPU配备...

18210

英伟达官宣:CUDA将全面支持RISC-V架构!

芯智讯

2025年7月17日,2025年RISC-V中国峰会正式在中国上海张江召开。人工智能芯片大厂英伟达(NVIDIA)副总裁 Frans Sijstermanns做...

12110

Window11 使用WSL2 Ubuntu RTX 5070 GPU 踩过的坑

用户9732312

首先打开控制面板——按下键盘【Win徽标键 + R键】,在“运行”窗口中输入“control”并回车

28510

CUDA is the incumbent,but is it any good?-Democratizing AI Part4

用户9732312

判断CUDA的“优劣”远非表面看起来那么简单。我们讨论的是其原始性能?功能特性?还是它在AI开发领域中的广泛影响?CUDA的“好坏”取决于提问者的身份与需求。本...

11610

Democratizing AI Compute, Part 3: How did CUDA succeed?

用户9732312

如果我们希望作为一个生态系统取得进步,就需要理解CUDA是如何变得如此强大的。理论上存在替代方案——AMD的ROCm、Intel的oneAPI、基于SYCL的框...

10510

Democratizing AI Compute, Part 2: What exactly is “CUDA”?

用户9732312

It seems like everyone has started talking about CUDA in the last year: It’s the...

9010

38:WSL2 CUDA不可用问题:全面分析与解决方案

安全风信子

作者: HOS(安全风信子) 日期: 2024-10-19 主要来源平台: GitHub 摘要: 本文深入分析WSL2环境中CUDA不可用的常见原因与解决...

36610

36:【2026】flash-attention/vLLM安装失败完整解决方案 - CUDA架构/版本适配

安全风信子

作者: HOS(安全风信子) 日期: 2026-02-16 主要来源平台: GitHub 摘要: 本文深入分析2026年flash-attention和v...

56410

29:【flash-attention / vLLM】安装失败(CUDA架构/版本不符)

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年flash-attention和v...

27610

26:【CUDA Tile / Blackwell】新架构报错 no kernel image / compute capability不匹配

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年NVIDIA最新的CUDA Til...

14710

CUB单次调用API:简化GPU并行算法开发

用户11764306

C++模板库CUB是实现高性能GPU基础算法(如扫描、排序、归约等)的首选工具。然而,其传统的“两阶段”API需要先估算临时内存大小,再显式分配内存并执行内核,...

10810

Sirius:GPU加速DuckDB,刷新ClickBench纪录

用户11764306

Sirius是一个GPU原生的SQL引擎,旨在为DuckDB提供即插即用的加速功能,未来也将支持其他数据系统。

10310

聚焦算法:深入解析NVIDIA CUDA Tile硬件抽象技术

用户11764306

随着自2006年NVIDIA CUDA平台发明以来最大的一次进步,CUDA 13.1推出了NVIDIA CUDA Tile。这项激动人心的创新引入了一个用于基于...

11610

老黄大出血!OpenAI背刺英伟达,微软自研芯连夜拆掉CUDA护城河?

新智元

老黄的噩梦成真了!2026年1月26日,微软数据中心(爱荷华)一声巨响,黄仁勋的后背瞬间凉透。

17010

Ubuntu22.04多显卡安装paddle GPU

Dragon水魅

通过https://docs.nvidia.cn/cuda/cuda-toolkit-release-notes/index.html找到与之对应的 CUDA ...

11810

谷歌430万颗TPU暴击CUDA护城河!Meta「割肉」助攻

新智元

该数据来自Global Semi Research(全球半导体研究)最新的一项独立研究。

28510

深入解析NVIDIA CUDA Tile:面向GPU的平铺编程新范式

用户11764306

随着CUDA 13.1的发布,该平台引入了自2006年诞生以来最重大的进展之一:NVIDIA CUDA Tile。这项令人兴奋的创新引入了一个面向基于平铺(Ti...

40110
领券