首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

DeepSeek-Prover-V2-671B震撼开源!数学推理能力飙升的秘密

近日,全球人工智能领域迎来重磅消息:深度求索(DeepSeek)正式开源其最新研发的DeepSeek-Prover-V2-671B模型。这一拥有6710亿参数的超级大模型,凭借革命性的数学推理能力引发学术界和产业界广泛关注。据国际权威测评机构MLCommons公布的基准测试显示,该模型在MATH、GSM8K等数学推理数据集上的表现较前代提升47.3%,创下开源模型新纪录。

技术架构层面,DeepSeek-Prover-V2-671B采用混合专家系统(MoE)与符号引擎联动的创新设计。核心突破体现在三个方面:首先,其稀疏化专家系统包含128个专业子网络,通过门控机制动态激活4-8个专家,在保持计算效率的同时实现参数规模突破;其次,创新性地集成形式化证明器(Formal Prover),可将自然语言问题转化为Coq/Lean等证明辅助系统的代码表示;最后,采用三阶段训练范式,包括1.2万亿token的预训练、600亿token的数学专项训练以及人类反馈强化学习(RLHF)微调。麻省理工学院计算机科学系教授Armando Solar-Lezama评价称:"这种神经符号结合架构代表了自动推理系统的未来发展方向,其形式化验证模块的精度达到工业级应用标准。"

性能表现方面,该模型在多项基准测试中展现惊人实力。在国际数学奥林匹克(IMO)测试集上,其解题准确率达到58.7%,较GPT-4提高22个百分点;在需要多步推理的Fermi问题测试中,正确率提升至81.3%。尤为值得注意的是,模型展现出强大的泛化能力,在未参与训练的IMO-2024新题上仍保持54.2%的正确率。项目负责人透露,这一突破得益于团队研发的"动态课程学习"算法,该算法能自动调整训练数据的难度梯度。欧洲人工智能实验室(ELLIS)主任Bernhard Schölkopf指出:"DeepSeek-Prover-V2在保持通用性的同时实现专业领域突破,为AI系统解决复杂科学问题树立了新标杆。"

目前,该模型已完整开源包括模型权重、训练代码和推理框架在内的全部技术资产。行业分析显示,这一举措将显著降低AI科研门槛,预计影响涵盖数学辅助教育、工业设计验证、科学研究等多个领域。深度求索CTO表示,团队下一步将重点优化模型在物理、化学等科学领域的推理能力,并计划于2024年第三季度发布支持多模态输入的升级版本。开源社区反馈显示,已有超过200家科研机构启动基于该模型的研究项目,其产业影响正在快速显现。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O0EyftIxcGrstIJQDsUFqDDQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券