首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >DeepSeek R2没来,Kimi K2来了,VLLM,SGLang首发支持

DeepSeek R2没来,Kimi K2来了,VLLM,SGLang首发支持

作者头像
用户11563501
发布2026-06-23 08:51:47
发布2026-06-23 08:51:47
1180
举报

受到deepseek的刺激和启发,杨植麟想通了,走上了开源的路线。

Moonshot AI昨日正式发布Kimi K2大语言模型,采用混合专家(MoE)架构,总参数量达1万亿,激活参数32B,支持128K上下文长度。该模型在代码生成、Agent任务和数学推理等专业领域展现出领先性能,并在多个基准测试中创造了开源模型的新SOTA记录。

核心技术创新

  • MuonClip优化器

采用创新的MuonClip技术替代传统Adam优化器,通过qk-clip机制控制注意力logits规模,在15.5T token训练过程中保持零损失峰值,解决了大规模模型训练稳定性问题。

  • 大规模Agent数据合成

构建覆盖数百领域、数千工具的合成pipeline,通过LLM评估筛选高质量样本,显著提升了模型的工具调用能力。

  • 通用强化学习框架

引入自我评价机制(self-judging),在可验证任务(代码/数学)和不可验证任务间建立奖励关联,增强模型泛化能力。

性能表现

在SWE Bench Verified、Tau2、AceBench等基准测试中,Kimi K2表现突出:

  • SWE Bench Verified单次尝试准确率65.8%
  • Tau2零售场景平均得分70.6
  • LiveCodeBench v6 Pass@1达53.7%

开源与部署

本次发布包含两个版本:

  • Kimi-K2-Base:基础预训练模型,适合科研与定制场景
  • Kimi-K2-Instruct:通用指令微调版本,优化问答与Agent任务

模型采用修改版MIT协议开源,vLLM、SGlang等推理引擎首发支持部署。目前已同步上线Web端、App和API服务。

Image
Image
Image
Image
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI工程化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 核心技术创新
  • 性能表现
  • 开源与部署
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档