首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

DeepSeek发布最新开源数学推理模型Prover-V2-671B

【太平洋科技快讯】4月30日消息,DeepSeek 在 AI 开源社区 Hugging Face 发布了其最新数学推理模型——DeepSeek-Prover-V2-671B。该模型参数量高达 6710 亿,从命名推测,这可能是对去年发布的 Prover-V1.5 模型的重大升级。

DeepSeek-Prover-V2-671B 基于混合专家(MoE)架构,并采用 Lean 4 框架进行形式化推理训练。该模型结合了强化学习和大规模合成数据,显著提升了自动化证明能力。此外,新模型支持 BF16、FP8 和 F32 等多种计算精度,并采用高效的 safetensors 文件格式,使得训练和部署更加快速且节省资源。

该模型的发布也可能为 DeepSeek 的 R2 系统铺路,进一步验证其在复杂推理任务中的能力。同时,它也为 AI 在数学领域的应用提供了新的可能性,例如加速数学知识的发现和验证。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OmZYAkKb6HndKIqGji0ygNmw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券