◆ 推理Inflection时刻的到来:


◆去年GTC上,老黄看到了至2026年、对Blackwell和Rubin约5000亿美元的高可信度需求。今年的GTC可以清晰地看到:至少到2027年,需求将达到1万亿美元。而且实际计算需求将远高于此。

◆从Hopper H200到Grace Blackwell,摩尔定律预期能带来约1.5倍的提升,但实际提升达到35倍的每瓦性能(Semianalysis分析有50倍),实现了全球最低的token成本。

◆ Vera Rubin: 十年提升算力4亿倍

◆ 用于Vera Rubin的CPO交换机及交换芯片


◆垂直安装在Kyber中背板的Compute Tray,以及实现144个GPU互连的交换背板,同样是垂直放置。



◆Vera Rubin推理成本较前代下降 10 倍,预计2026 年下半年生产,Vera Rubin+LPX未来解锁3万亿市场。


◆Grok3 LPU登场,单颗Groq 3 LPU的SRAM达到500MB, 带宽达到了150TB/s。8颗LPU组成的compute tray相比Rubin GPU有55倍的内存带宽提升。


◆ Groq 3 LPX的ComputeTray结构


◆Vera Rubin总结:全栈计算的代际飞跃,包含7 款突破性芯片、5 个机架级系统、1 台面向智能体 AI 的革命性超级计算机。该平台还包括全新的英伟达 Vera CPU 与 BlueField-4 STX 存储架构。

◆ Roadmap:Vera Rubin将采用CPO scale out,而下一代Feynman将采取铜和光(CPO)的scale up以及CPO scale out。
Feynman将搭载全新 CPU——Rosa,以罗莎琳德·富兰克林命名。正是她的 X 射线晶体学研究揭示了 DNA 结构,重塑了现代生物学。正如富兰克林揭开了生命隐藏的结构,Rosa 旨在全面调度智能体 AI 工作负载的完整结构——在 GPU、LPU、存储和网络之间高效调度数据、工具与 Token。黄仁勋介绍,Rosa 支撑起一个全新平台,搭配英伟达下一代 LPU LP40、BlueField-5、CX10,通过英伟达 Kyber 实现铜缆与共封装光学的横向扩展,并通过英伟达 Spectrum 级光互联实现纵向扩展。这也是第一次将光引入到scale up域。("We will have Kyber, which is copper scale up. We will also have Kyber CPO scale up.So for the first time, we will scale up with both copper and co-package optics")。整体而言,Feynman 一代将全面升级 AI 工厂的每一根支柱:计算、内存、存储、网络与安全。

◆关于铜和光到底谁进谁退,老黄这样说:
Okay, and so a lot of people have been asking, jensen, is copper going to still be important? The answer is yes. Jensen, are you going to scale up optical? Yes. Are you gonna scale out optical? Yes, and so for everybody who is in our ecosystem, we need a lot more capacity, and that's really the key. We need a lot more capacity for copper. We need a lot more capacity for optics. We need a lot more capacity for CPO, and that's the reason why we've been working with all of you to lay the foundation for this level of growth.
(非常期待短短的这段话今天可以被二创出多少分析内容🤓)
◆太空数据中心
