在 AI 圈,Scaling Law 几乎被奉为真理:模型越大,性能越强。但这个“强”是有代价的。动辄数千亿参数的模型,不仅让推理成本(VRAM、延迟)变成天文...
过去几十年计算成本持续下降,但Dennard缩放的终结推动计算架构从通用CPU转向多核并行,GPU凭借极致并行性成为AI与超算的核心算力载体,当前全球排名前十的...
一、研究背景与核心矛盾 随着AI算力集群规模持续扩张,光互连功耗占比不断攀升,当前规模扩展型光互连已占计算总功耗的7%且仍呈增长趋势。在完整光链路中,激光源...
这不是段子,而是 Bryan Catanzaro—Nvidia 应用深度学习副总裁—的原话。在 AI 席卷全球、科技公司疯狂裁员的当下,这个来自卖铲子的人的表态...
NVIDIA 在 AI Agent 安全赛道押注的「装前体检「工具——用 16 类 64 条规则 + 两阶段静态/LLM 流水线,把 Claude Code /...
NVIDIA发布Rubin CPX,这是一款专门为大规模上下文AI推理设计的新型GPU。
AI产业正沿着大规模训练与高吞吐量实时推理两条主线高速演进,其中训练算力以每年约4.3倍的速度增长以实现涌现推理能力,而商业化落地带来的"生成瓶颈"则要求GPU...
- Driver Version 为 cuda 驱动版本;CUDA Version 为该驱动支持的最高 cuda toolkit 版本;cuda 驱动支持向后...
之前在网上刷视频的时候,经常会遇到一个特别让人崩溃的问题——关键画面总被打上厚厚的马赛克。 想认真看内容,却只能看到一堆像素块,体验直接拉满折磨值。
Nvidia推出了Jetpack 7.2,这使得逗留在Jetpack 5.1.1的Jetson AGX Orin 32G突然之间可以焕发青春了。
熟悉CUDA开发的开发者都知道,编译GPU程序时离不开sm_XX架构参数。长久以来,大家默认sm版本只是对应一代GPU架构的简单标签:sm_75对应Turing...
查询当前可用免费模型列表: https://build.nvidia.com/models?filters=nimType%3Anim_type_previe...
6月2日,阿里云通义千问团队发布 Qwen3.7 Plus,距 Qwen3.7 Max(5月21日)仅 12 天,这是全球大模型厂商中罕见的双周级更新节奏。
在台北 Computex 2026大展上,NVIDIA 由黄仁勋亲自揭晓的RTX Spark 超级芯片(Superchip),无疑是本届展会最大重磅亮点。对于硬...
腾讯科技(深圳)有限公司 | 数据分析 (已认证)
生成式AI驱动娱乐社交应用增长,腾讯云携手NVIDIA提供全栈解决方案 行业面临内容创作效率与用户互动体验的双重瓶颈 全球娱乐与社交应用市场增长迅猛,但竞争加剧...
而且这只是它的数据中心业务收入——还不算游戏、汽车、专业可视化。整体营收同比增长 85%,相当于每天进账超过 3 亿美元。
随着人工智能(AI)技术的快速发展,全球众多企业自去年以来纷纷启动裁员,外界也将此归咎于AI的导入。然而,英伟达(Nvidia)CEO黄仁勋日前接受媒体专访时强...
当前算力基建已是 AI 领域核心风口,国内2026年度投资规模预估将突破 1.5 万亿元,行业预测未来五年的复合年均增长率保守超 40%,至2030年将超过5万...
NVIDIA cuVS 在 GPU 上构建 HNSW 图,使 Elasticsearch 中的向量索引速度最高提升 12 倍。本文将介绍两种生产部署模式:模式 ...