首页
学习
活动
专区
圈层
工具
发布

全网期待的 DeepSeek R2 为何迟迟不发?梁文锋这一举动成关键!

以下文章来源于MaxAIBox,作者Max

据科技媒体 The Information 最近报道,两名知情人士透露,DeepSeek 尚未确定 R2 模型的发布时间,原因是梁文锋对其性能不满意。

此前早些时候曾报道,DeepSeek R2 推理模型原计划于 5 月发布,旨在提升编程能力,并实现多语言推理(英语之外)。

The Information 称,在过去几个月里,DeepSeek 的工程师一直在优化 DeepSeek R2,等待梁文峰批准发布。

报道援引向企业客户提供 DeepSeek 模型的中国头部云服务商员工的话指出,由于美国出口管制导致英伟达服务器芯片在中国供应短缺,DeepSeek R2 即使发布也难以快速推广。

报道还称,对 DeepSeek R2 的需求一旦激增,将令中国云服务商不堪重负,因为运行人工智能模型需要英伟达的先进芯片。

报道指出,DeepSeek 已与部分中国云企业接洽,向它们提供技术规格,以便这些企业规划在其服务器上托管和分发 DeepSeek R2 模型的方案。

The Information 表示,在目前使用 R1 模型的云客户中,大多数是通过英伟达 H20 芯片运行该模型。

特朗普政府 4 月实施的新一轮出口管制,已禁止英伟达向中国市场销售 H20 芯片

,它是此前英伟达唯一能合法对华出口的 AI 处理器。

- EOF -

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OIJsl4RZDf5uq60-dE0o8gpw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券