部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >速报!DeepSeek-Prover-V2-671B 悄然上线,或为 R2 铺路?

速报!DeepSeek-Prover-V2-671B 悄然上线,或为 R2 铺路?

作者头像
AgenticAI
发布2025-05-01 21:57:13
发布2025-05-01 21:57:13
2350
举报
文章被收录于专栏:AgenticAIAgenticAI

五一没等来 DeepSeek R2,DeepSeek 却悄悄放出了一个超级炸裂的新模型:DeepSeek-Prover-V2-671B!这究竟是什么?对 DeepSeek 的未来又意味着什么?

它的前身:DeepSeek-Prover-V1.5

时间回到 2024 年 8 月,DeepSeek 发布了论文 👉 DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search[1]

同时还开源了对应的基座模型:DeepSeek-Prover-V1.5-Base[2]

V1.5 主要亮点:

  • ✅ 融合 监督微调 + 强化学习 + 改进版 MCTS(蒙特卡洛树搜索)
  • ✅ 提出了创新的截断与恢复机制,大幅提升模型在复杂推理任务中的表现
  • ✅ 强调“内在奖励驱动的探索”,推动语言模型在形式化数学证明中的应用边界
  • ✅ 多项指标全面超越前代最佳模型

一句话总结:不仅懂语言,还会“思考”怎么去证明!

那 Prover-V2 是什么?

虽然官方暂未公布论文或细节,但从模型命名「V2」以及参数规模「671B」来看,这或许是 DeepSeek 正在为 R2 做能力验证或预热

回顾 V1.5 的定位,它更多是面向形式化定理证明这个细分领域。而 V2 的上线,很可能意味着:

  • DeepSeek 在复杂推理能力方面又迈出了一大步
  • 有望将 证明型智能 融入更大规模通用模型中
  • R2 的「思维深度」可能远超我们此前的预期

小结

DeepSeek-Prover-V2-671B 目前已在 HuggingFace 上架,但尚未大张旗鼓地宣传。 这款“隐秘发布”的模型,也许正是 DeepSeek R2 前夜的“预告片”。

HuggingFace 地址:https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B,速度围观!

R2 没来,但 Prover-V2 先行。下一步,值得期待的,不只是更强的模型,而是语言智能在“思维”与“证明”之间的那条路。

最后,我们已经建立了 Agentic AI 开发交流群,后台回复进群即可。

参考资料

[1]

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search: https://arxiv.org/abs/2408.08152

[2]

DeepSeek-Prover-V1.5-Base: https://huggingface.co/deepseek-ai/DeepSeek-Prover-V1.5-Base

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 它的前身:DeepSeek-Prover-V1.5
  • 那 Prover-V2 是什么?
  • 小结
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档