gpu - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签gpu

#gpu

告别重复编译！CUDA 13.0统一Arm/服务器工具链，边缘开发效率提升300%

GPUS Lady 2天前2025-10-10 12:23:16

随着NVIDIA Blackwell GPU架构赋能的Jetson Thor SoC发布，CUDA 13.0通过一系列创新优化，重新定义了嵌入式与边缘AI的开发...

19210

内存焦虑？长文梳理： HBM/DRAM/CXL/HBF/GPU-Direct

数据存储前沿技术 3天前2025-10-09 10:42:56

在人工智能，特别是大语言模型（LLM）和基础模型飞速发展的今天，模型的规模和复杂性呈指数级增长，对内存容量和带宽的需求急剧膨胀，传统CPU-DRAM与块存储的两...

41620

GPU编程与架构：你新买的5090到底是怎么工作的？

腾讯云开发者 12天前2025-09-30 14:37:57

“你买的4090多少钱？”、“H100性能真厉害！” ，GPU的价格性能一直是大家乐于谈论的话题，作者也经常可以在茶余饭后听到这样的讨论。在热火朝天地谈论性能指...

16610

超级计算力量：一文看懂GPU并行计算CUDA

Lion 莱恩呀 26天前2025-09-16 23:12:26

CUDA（Compute Unified Device Architecture），是显卡厂商NVIDIA推出的运算平台。CUDA™是一种由NVIDIA推出的通...

39500

致敬园丁，腾讯云HAI献礼教师节！GPU算力券5折起

腾讯云计算产品团队

腾讯云｜产品团队 (已认证)

2025-09-112025-09-11 18:43:37

大型语言模型（LLM）部署、AI作画、数据科学项目需要强大的GPU算力支持，但动辄上万的硬件投入和维护成本让人望而却步。现在，腾讯云高性能应用服务HAI为您提供...

14110

gpu线上测试(毒蘑菇测试)

用户10974407 2025-09-102025-09-10 16:40:23

起初，我在搜索引擎里输入 “GPU 性能测试工具”，结果跳出的全是需要下载安装的软件。有的工具安装包动辄好几百兆，还附带一堆捆绑插件，一不小心就会把电脑弄得乌烟...

67010

服务器核心组件：CPU 与 GPU 的核心区别、应用场景、协同工作

云惑雨问 2025-09-082025-09-08 18:06:06

在服务器硬件里，CPU和GPU就像两位各司其职的“核心工匠”：一个擅长处理复杂精密的“细活”，一个精通批量高效的“粗活”。很多人知道它们都是“计算引擎”，却分不...

27210

开发 Operator 调度 GPU 实例资源池

没有故事的陈师傅 2025-09-042025-09-04 12:00:00

作者：乔克公众号：运维开发故事博客：https://jokerbai.com

17210

光量子计算与经典HPC的融合：ORCA Computing与Nvidia展示多GPU/QPU协同下的经典-量子混合算法实践

光芯 2025-09-032025-09-03 16:58:25

新计算技术的规模化普及需满足两大前提：一是融入多技术、多学科交织的异构工作流，二是实现全生命周期“价值＞成本”平衡（需覆盖数据中心改造、运维开销、人...

27210

48块GPU训练对标千亿参数SOTA！达摩院等发布基于LLM的自回归视频生成模型Lumos-1

AI生成未来 2025-08-272025-08-27 15:06:50

文章链接：https://arxiv.org/pdf/2507.08801 项目链接：https://github.com/alibaba-damo-acad...

22210

100天跟着CP学PostgreSQL+AI,第20天 : 分布式训练架构：PostgreSQL 如何支持多 GPU 协同

用户8465142 2025-08-272025-08-27 14:08:53

作者介绍：崔鹏，计算机学博士，专注 AI 与大数据管理领域研究，拥有十五年数据库、操作系统及存储领域实战经验，兼具 ORACLE OCM、MySQL OCP 等...

17810

为什么光会写 SQL 还不够？数据库优化的进化之路

用户11680974 2025-08-262025-08-26 11:26:33

在一次企业数据报表会上，王工盯着屏幕上的 SQL 查询结果皱起了眉头：原本几秒就能生成的销售报表，现在居然要几十秒。团队第一反应是，“加索引就好了。”然而，当数...

19010

【教程】后台监听GPU使用情况并自动记录和画图

小锋学长生活大爆炸 2025-08-242025-08-24 16:56:44

本脚本用于自动监控多卡 GPU 的使用状态，当某张 GPU 连续活跃超过设定秒数时开始记录该卡的使用情况，并在其连续空闲超过设定时间后自动停止记录，并生成图像报...

26610

MXFP4量化：如何在80GB GPU上运行1200亿参数的GPT-OSS模型

deephub 2025-08-202025-08-20 15:47:47

大型语言模型（Large Language Models, LLMs）如GPT-OSS、GPT-4、LLaMA和Mixtral的快速发展显著提升了人工智能的能力...

35210

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

deephub 2025-08-202025-08-20 15:35:47

NumPy作为Python数值计算领域的基础框架，凭借其强大的N维数组结构和丰富的函数生态系统，成为科学家、工程师和数据分析师的核心工具。然而，随着计算需求的快...

15010

构建高性能LLM推理服务的完整方案：单GPU处理172个查询/秒、10万并发仅需15美元/小时

deephub 2025-08-202025-08-20 15:08:47

在构建智能代理、检索增强生成（RAG）系统或大语言模型应用时，核心组件往往是通过API访问的大语言模型（LLM）。专业的服务提供商通过模型优化技术实现高效且可扩...

31910

CUDA重大更新：原生Python可直接编写高性能GPU程序

deephub 2025-08-202025-08-20 14:22:40

NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新：CUDA并行计算平台正式支持原生Python编程。这一突破性进展将消除Python开发...

20410

CPU、GPU、NPU、TPU、DPU的简单了解

小驰行动派 2025-08-092025-08-09 16:17:12

这是一个以计算和存储为核心的架构， CPU 作为处理器单元，负责完成各种算术和逻辑计算。而内存（运存）和硬盘（外部存储），负责存储数据，与 CPU 交互。

57610

#gpu

告别重复编译！CUDA 13.0统一Arm/服务器工具链，边缘开发效率提升300%

内存焦虑？长文梳理： HBM/DRAM/CXL/HBF/GPU-Direct

GPU编程与架构：你新买的5090到底是怎么工作的？

超级计算力量：一文看懂GPU并行计算CUDA

致敬园丁，腾讯云HAI献礼教师节！GPU算力券5折起

gpu线上测试(毒蘑菇测试)

服务器核心组件：CPU 与 GPU 的核心区别、应用场景、协同工作

开发 Operator 调度 GPU 实例资源池

光量子计算与经典HPC的融合：ORCA Computing与Nvidia展示多GPU/QPU协同下的经典-量子混合算法实践

48块GPU训练对标千亿参数SOTA！达摩院等发布基于LLM的自回归视频生成模型Lumos-1

100天跟着CP学PostgreSQL+AI,第20天 : 分布式训练架构：PostgreSQL 如何支持多 GPU 协同

为什么光会写 SQL 还不够？数据库优化的进化之路

【教程】后台监听GPU使用情况并自动记录和画图

MXFP4量化：如何在80GB GPU上运行1200亿参数的GPT-OSS模型

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

构建高性能LLM推理服务的完整方案：单GPU处理172个查询/秒、10万并发仅需15美元/小时

CUDA重大更新：原生Python可直接编写高性能GPU程序

CPU、GPU、NPU、TPU、DPU的简单了解

热门专栏

腾讯云服务器团队的专栏

饶文津的专栏

腾讯技术工程官方号的专栏

AI科技大本营的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐