首页
学习
活动
专区
圈层
工具
发布

#nvidia

一文读懂 NVIDIA 与 Sakana AI 联手打造的稀疏 LLM 黑科技

唐国梁Tommy

在 AI 圈,Scaling Law 几乎被奉为真理:模型越大,性能越强。但这个“强”是有代价的。动辄数千亿参数的模型,不仅让推理成本(VRAM、延迟)变成天文...

9910

VLSI 2026 Nvidia短课:硅光互联如何破解AI算力的带宽与功耗困局

光芯

过去几十年计算成本持续下降,但Dennard缩放的终结推动计算架构从通用CPU转向多核并行,GPU凭借极致并行性成为AI与超算的核心算力载体,当前全球排名前十的...

14410

VLSI 2026 | NVIDIA 3D堆叠32Gbps NRZ光接收机:自定时DFE实现-18.5dBm OMA灵敏度与0.416pJ/b能效

光芯

一、研究背景与核心矛盾 随着AI算力集群规模持续扩张,光互连功耗占比不断攀升,当前规模扩展型光互连已占计算总功耗的7%且仍呈增长趋势。在完整光链路中,激光源...

10210

Nvidia高管承认:AI算力比人工还贵

安徽开发者圈

这不是段子,而是 Bryan Catanzaro—Nvidia 应用深度学习副总裁—的原话。在 AI 席卷全球、科技公司疯狂裁员的当下,这个来自卖铲子的人的表态...

8010

GitHub推荐:NVIDIA SkillSpector,MCP 装前扫描器,把 AI Agent 安全做成规则集

智能时代蛮子

NVIDIA 在 AI Agent 安全赛道押注的「装前体检「工具——用 16 类 64 条规则 + 两阶段静态/LLM 流水线,把 Claude Code /...

18500

NVIDIA 推出Rubin CPX,专为AI推理设计的GPU

用户11563501

NVIDIA发布Rubin CPX,这是一款专门为大规模上下文AI推理设计的新型GPU。

7910

2026 ECTC:Nvidia联合Lumentum报道面向共封装光互连的DWDM CW-DFB-SOA激光器阵列设计与封装

光芯

AI产业正沿着大规模训练与高吞吐量实时推理两条主线高速演进,其中训练算力以每年约4.3倍的速度增长以实现涌现推理能力,而商业化落地带来的"生成瓶颈"则要求GPU...

20510

Windows 升级 Cuda 驱动版本图文步骤

代码简单说

- Driver Version 为 cuda 驱动版本;CUDA Version 为该驱动支持的最高 cuda toolkit 版本;cuda 驱动支持向后...

26410

Lada v0.11.0最新版更新 本地一键启动包教程:AI去马赛克神器实测 支持 Nvidia显卡和Intel Arc GPU

代码简单说

之前在网上刷视频的时候,经常会遇到一个特别让人崩溃的问题——关键画面总被打上厚厚的马赛克。 想认真看内容,却只能看到一堆像素块,体验直接拉满折磨值。

59410

Nvidia Jetson AGX Orin 32G升级到Jetpack 7.2(含踩坑记录)

GPUS Lady

Nvidia推出了Jetpack 7.2,这使得逗留在Jetpack 5.1.1的Jetson AGX Orin 32G突然之间可以焕发青春了。

18910

看懂NVIDIA GPU的SM后缀:sm_90、sm90a、sm_100f核心差异解析

GPUS Lady

熟悉CUDA开发的开发者都知道,编译GPU程序时离不开sm_XX架构参数。长久以来,大家默认sm版本只是对应一代GPU架构的简单标签:sm_75对应Turing...

19410

NVIDIA-OpenCode-免费模型使用指南

zeekling

查询当前可用免费模型列表: https://build.nvidia.com/models?filters=nimType%3Anim_type_previe...

70310

AI早报 | 6月4日:Qwen3.7 Plus 前日上线,Anthropic 公开 Claude 安全机制,NVIDIA Cosmos 3 开启物理AI新纪元

小博测试成长之路

6月2日,阿里云通义千问团队发布 Qwen3.7 Plus,距 Qwen3.7 Max(5月21日)仅 12 天,这是全球大模型厂商中罕见的双周级更新节奏。

38710

理性解析NVIDIA RTX Spark真实实力、差异与适用场景全盘梳理

GPUS Lady

在台北 Computex 2026大展上,NVIDIA 由黄仁勋亲自揭晓的RTX Spark 超级芯片(Superchip),无疑是本届展会最大重磅亮点。对于硬...

2.7K30

生成式AI驱动娱乐社交应用增长,腾讯云携NVIDIA推全栈方案

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

生成式AI驱动娱乐社交应用增长,腾讯云携手NVIDIA提供全栈解决方案 行业面临内容创作效率与用户互动体验的双重瓶颈 全球娱乐与社交应用市场增长迅猛,但竞争加剧...

15610

单季752亿美元,毛利率78%:NVIDIA正在成为AI时代的标准石油

老周聊架构

而且这只是它的数据中心业务收入——还不算游戏、汽车、专业可视化。整体营收同比增长 85%,相当于每天进账超过 3 亿美元。

27610

黄仁勋痛批“裁员赖AI”:过于懒惰且毫无道理!

芯智讯

随着人工智能(AI)技术的快速发展,全球众多企业自去年以来纷纷启动裁员,外界也将此归咎于AI的导入。然而,英伟达(Nvidia)CEO黄仁勋日前接受媒体专访时强...

15710

一文分清 NVIDIA 三大专家认证AII/AIO/AIN,拿捏 AI 基建时代职场红利

GPUS Lady

当前算力基建已是 AI 领域核心风口,国内2026年度投资规模预估将突破 1.5 万亿元,行业预测未来五年的复合年均增长率保守超 40%,至2030年将超过5万...

40110

Elasticsearch 向量索引速度提升 12 倍:在 GPU 和 CPU 层部署 NVIDIA cuVS

点火三周

NVIDIA cuVS 在 GPU 上构建 HNSW 图,使 Elasticsearch 中的向量索引速度最高提升 12 倍。本文将介绍两种生产部署模式:模式 ...

16010
领券