开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >国内AI推理大模型可用吗？

国内AI推理大模型可用吗？

原创

作者头像

算法一只狗

发布于 2025-01-10 22:57:18

发布于 2025-01-10 22:57:18

1350

举报

文章被收录于专栏：算法一只狗算法一只狗

我这里推荐两个比较强的推理大模型。

KIMI推出的数学推理模型k0-math

KIMI推出的数学推理模型k0-math，可以直接去到官网体验

在 Kimi 网页版中，选择侧边栏的“眼镜”图标，即可使用基于 k0-math 模型的 Kimi 数学版，官方称后续会推出手机版。

官方表示，数学公式推荐使用 LaTeX 格式，可以截图或拍照给 Kimi 常规版，让 Kimi 把图片转为 LaTeX 格式，然后复制题目给 Kimi 数学版即可。

在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中，k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。

实测模型能力

测试一下难倒广大中国网友的调休怎么调的问题。之前关于调休就上过热搜

由于之前国庆节和中秋是连着来，所以网友盘算着怎么调休才算最优解，这里的“上6休3上3休2上5休1上2休7再上5休1”其实就是指从中秋开始休假的缩写。

说人话就是，从中秋开始，先上6天班，再休假3天，再上3天班，再休假2天，然后上5天班，接着休1天，再上2天班，最后国庆休7天，再上5天班，最后只休1天。说实话，就算我自己打字也觉得这个假期太复杂了，简直像是念咒语一样

那时候中国网友就为了这个调休到底最后休了多少天而计算起来

既然这么难，恰好可以丢给大模型进行问答，看看具备了数学推理能力的k0-math怎么计算这道数学难题。

一开始，KIMI错误的计算出了需要算整个9月的假期。但是我们题目是从9月9日开始的，所以其实只有10个周末是我们原本休息的。

重新纠正后，告诉它只有10个周末，它终于答对了这道题目，答案是只多休了4天假期。

由于之前国庆节和中秋是连着来，所以网友盘算着怎么调休才算最优解，这里的“上6休3上3休2上5休1上2休7再上5休1”其实就是指从中秋开始休假的缩写。

说人话就是，从中秋开始，先上6天班，再休假3天，再上3天班，再休假2天，然后上5天班，接着休1天，再上2天班，最后国庆休7天，再上5天班，最后只休1天。说实话，就算我自己打字也觉得这个假期太复杂了，简直像是念咒语一样

那时候中国网友就为了这个调休到底最后休了多少天而计算起来

既然这么难，恰好可以丢给大模型进行问答，看看具备了数学推理能力的k0-math怎么计算这道数学难题。

一开始，KIMI错误的计算出了需要算整个9月的假期。但是我们题目是从9月9日开始的，所以其实只有10个周末是我们原本休息的。

重新纠正后，告诉它只有10个周末，它终于答对了这道题目，答案是只多休了4天假期。

由于之前国庆节和中秋是连着来，所以网友盘算着怎么调休才算最优解，这里的“上6休3上3休2上5休1上2休7再上5休1”其实就是指从中秋开始休假的缩写。

说人话就是，从中秋开始，先上6天班，再休假3天，再上3天班，再休假2天，然后上5天班，接着休1天，再上2天班，最后国庆休7天，再上5天班，最后只休1天。说实话，就算我自己打字也觉得这个假期太复杂了，简直像是念咒语一样

那时候中国网友就为了这个调休到底最后休了多少天而计算起来

既然这么难，恰好可以丢给大模型进行问答，看看具备了数学推理能力的k0-math怎么计算这道数学难题。

一开始，KIMI错误的计算出了需要算整个9月的假期。但是我们题目是从9月9日开始的，所以其实只有10个周末是我们原本休息的。

重新纠正后，告诉它只有10个周末，它终于答对了这道题目，答案是只多休了4天假期。

Qwen版本o1推理模型QWQ

说实话，这个模型被称为Qwen QWQ，我是有点惊讶的。QWQ是不我们日常使用的颜文字吗？有理由怀疑qwen团队在训练这个模型的时候，已经有点魔怔了~

目前QwQ的模型权重已经放到了HuggingFace上，想要体验的可以去在线玩

模型在一些数学和编程领域的数据集都表现了比较好的效果，在一些数据集上，比如MATH-500中，其取得的效果还要比OpenAI的o1大模型效果要好。

目前QWQ放出来的版本，参数量只有32B，这个模型在本地也能够运行，也就是人人都能够自己搭建一个o1水平的推理模型

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S11#重启人生

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S11#重启人生

评论

登录后参与评论

0 条评论

热度

最新

目录

KIMI推出的数学推理模型k0-math

实测模型能力

Qwen版本o1推理模型QWQ