前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >国内AI推理大模型可用吗?

国内AI推理大模型可用吗?

原创
作者头像
算法一只狗
发布2025-01-10 22:57:18
发布2025-01-10 22:57:18
1350
举报
文章被收录于专栏:算法一只狗算法一只狗

我这里推荐两个比较强的推理大模型。

KIMI推出的数学推理模型k0-math

KIMI推出的数学推理模型k0-math,可以直接去到官网体验

在 Kimi 网页版中,选择侧边栏的“眼镜”图标,即可使用基于 k0-math 模型的 Kimi 数学版,官方称后续会推出手机版。

官方表示,数学公式推荐使用 LaTeX 格式,可以截图或拍照给 Kimi 常规版,让 Kimi 把图片转为 LaTeX 格式,然后复制题目给 Kimi 数学版即可。

在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。

实测模型能力

测试一下难倒广大中国网友的调休怎么调的问题。之前关于调休就上过热搜

由于之前国庆节和中秋是连着来,所以网友盘算着怎么调休才算最优解,这里的“上6休3上3休2上5休1上2休7再上5休1”其实就是指从中秋开始休假的缩写。

说人话就是,从中秋开始,先上6天班,再休假3天,再上3天班,再休假2天,然后上5天班,接着休1天,再上2天班,最后国庆休7天,再上5天班,最后只休1天。说实话,就算我自己打字也觉得这个假期太复杂了,简直像是念咒语一样

那时候中国网友就为了这个调休到底最后休了多少天而计算起来

既然这么难,恰好可以丢给大模型进行问答,看看具备了数学推理能力的k0-math怎么计算这道数学难题。

一开始,KIMI错误的计算出了需要算整个9月的假期。但是我们题目是从9月9日开始的,所以其实只有10个周末是我们原本休息的。

重新纠正后,告诉它只有10个周末,它终于答对了这道题目,答案是只多休了4天假期。

由于之前国庆节和中秋是连着来,所以网友盘算着怎么调休才算最优解,这里的“上6休3上3休2上5休1上2休7再上5休1”其实就是指从中秋开始休假的缩写。

说人话就是,从中秋开始,先上6天班,再休假3天,再上3天班,再休假2天,然后上5天班,接着休1天,再上2天班,最后国庆休7天,再上5天班,最后只休1天。说实话,就算我自己打字也觉得这个假期太复杂了,简直像是念咒语一样

那时候中国网友就为了这个调休到底最后休了多少天而计算起来

既然这么难,恰好可以丢给大模型进行问答,看看具备了数学推理能力的k0-math怎么计算这道数学难题。

一开始,KIMI错误的计算出了需要算整个9月的假期。但是我们题目是从9月9日开始的,所以其实只有10个周末是我们原本休息的。

重新纠正后,告诉它只有10个周末,它终于答对了这道题目,答案是只多休了4天假期。

由于之前国庆节和中秋是连着来,所以网友盘算着怎么调休才算最优解,这里的“上6休3上3休2上5休1上2休7再上5休1”其实就是指从中秋开始休假的缩写。

说人话就是,从中秋开始,先上6天班,再休假3天,再上3天班,再休假2天,然后上5天班,接着休1天,再上2天班,最后国庆休7天,再上5天班,最后只休1天。说实话,就算我自己打字也觉得这个假期太复杂了,简直像是念咒语一样

那时候中国网友就为了这个调休到底最后休了多少天而计算起来

既然这么难,恰好可以丢给大模型进行问答,看看具备了数学推理能力的k0-math怎么计算这道数学难题。

一开始,KIMI错误的计算出了需要算整个9月的假期。但是我们题目是从9月9日开始的,所以其实只有10个周末是我们原本休息的。

重新纠正后,告诉它只有10个周末,它终于答对了这道题目,答案是只多休了4天假期。

Qwen版本o1推理模型QWQ

说实话,这个模型被称为Qwen QWQ,我是有点惊讶的。QWQ是不我们日常使用的颜文字吗?有理由怀疑qwen团队在训练这个模型的时候,已经有点魔怔了~

目前QwQ的模型权重已经放到了HuggingFace上,想要体验的可以去在线玩

模型在一些数学和编程领域的数据集都表现了比较好的效果,在一些数据集上,比如MATH-500中,其取得的效果还要比OpenAI的o1大模型效果要好。

目前QWQ放出来的版本,参数量只有32B,这个模型在本地也能够运行,也就是人人都能够自己搭建一个o1水平的推理模型

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • KIMI推出的数学推理模型k0-math
  • 实测模型能力
  • Qwen版本o1推理模型QWQ
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档