以下文章来源于MaxAIBox,作者Max
据科技媒体 The Information 最近报道,两名知情人士透露,DeepSeek 尚未确定 R2 模型的发布时间,原因是梁文锋对其性能不满意。
此前早些时候曾报道,DeepSeek R2 推理模型原计划于 5 月发布,旨在提升编程能力,并实现多语言推理(英语之外)。
The Information 称,在过去几个月里,DeepSeek 的工程师一直在优化 DeepSeek R2,等待梁文峰批准发布。
报道援引向企业客户提供 DeepSeek 模型的中国头部云服务商员工的话指出,由于美国出口管制导致英伟达服务器芯片在中国供应短缺,DeepSeek R2 即使发布也难以快速推广。
报道还称,对 DeepSeek R2 的需求一旦激增,将令中国云服务商不堪重负,因为运行人工智能模型需要英伟达的先进芯片。
报道指出,DeepSeek 已与部分中国云企业接洽,向它们提供技术规格,以便这些企业规划在其服务器上托管和分发 DeepSeek R2 模型的方案。
The Information 表示,在目前使用 R1 模型的云客户中,大多数是通过英伟达 H20 芯片运行该模型。
特朗普政府 4 月实施的新一轮出口管制,已禁止英伟达向中国市场销售 H20 芯片
,它是此前英伟达唯一能合法对华出口的 AI 处理器。
- EOF -