首页
学习
活动
专区
圈层
工具
发布

GLM-4.5原生推理、代码、Agentic能力究竟怎么样,实测来了!

大家好,我是绛烨。

昨天晚上智谱发布开源了他们家新的旗舰模型GLM4.5,一款专为智能体应用打造的智能体基座模型。

看到身边很多开发者都在讨论这个,都说代码能力非常优秀。

本次智谱开源的GLM-4.5模型,在综合性能SOTA、更高的参数效率、低成本和高速度方面有很多值得看的点。

综合性能SOTA

之前的智能体里面的模型,要么是分为functionCall、代码、对话、Thinking模型,一个模型很难兼容这么多的能力,需要根据不同的场景选择不同的模型。

而现在,模型更加聪明了。

GLM-4.5是首个在单个模型中实现了推理、代码、智能体等多能力原生融合,适配从对话生成到智能体任务的多类场景。

这种融合多种能力之后的通用基座模型,能力丝毫不弱于其他模型,并且在多个评测基准里面取得领先的成绩。

综合评估下来,GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。

性能表现怎么样?

GLM-4.5作为原生Agentic基座模型,可以胜任全栈开发任务,编写各种应用、游戏、交互网页。

比如可以用它做一个3D 交互式地球网页。

创建一个3D网页,展示一个简化的太阳系模型。页面中央是太阳(可发光效果),周围环绕着3-5个简化的行星(不同大小、颜色)。用户可以用鼠标拖拽来旋转整个太阳系视图。点击某个行星时,视角会聚焦到该行星,并弹出一个小框显示行星名称和一段简短的介绍(例如:‘火星:红色星球’)。

体验:https://chat.z.ai/space/x07bt6z0m6d0-art

还可以用它制作非常好玩的游戏。

制作一个基于网页的3D冥想空间。场景为一个开放的、漂浮着抽象粒子或几何体的空间。用户可以播放(或模拟播放)一段背景音乐。空间中的粒子或几何体应随着音乐的节奏和音量变化而动态地跳动、闪烁或变换颜色。玩家可以自由旋转视角,感受空间的变化。

体验:https://chat.z.ai/space/p0bbx62yabm1-art

当然它也可以是打工人的省心搭子,可以用它制作PPT或者图文卡片,它会自主搜索资料、寻找配图,根据实际材料直接以HTML形式编写图文,从而使信息更准确、排版更灵活。

向下滑动查看所有内容

创作3张低饱和的书签,用墨、金墨及国画颜料中的钛白和朱砂进行装饰性书写,内容为诗句:

图1:他皆携酒寻芳去,我独关门好静眠。

图2:双扉昼掩薛萝深,一榻清风太古心。

图3:冰雪林中著此身,不同桃李混芳尘。

制作一个Xbox 360控制器的SVG图像 。

除此之外,它也可以接入claude code,直接调用API即可,目前它已经兼容了 Anthropic API 。

更高的参数效率

GLM-4.5模型使用了更加高效的参数效率,也就是说,模型参数比DeepSeek-R1和Kimi-K2更低,模型能力在多个基准测试榜单上表现的更加出色。

在相同规模参数的模型下,GLM-4.5 系列实现了最佳性能,这一点可以从衡量模型代码能力的 SWE-bench Verified 榜单排名可以看到,GLM-4.5 系列位于性能/参数比帕累托靠前的位置。

低成本、高速度

除了上面介绍的参数优化之外,GLM-4.5系列模型也极大的降低了模型的使用成本。

目前API调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens,简直就是白菜价。

除了这种低成本的优势之外,模型生成的速度也非常快,超过 100 tokens/秒,支持低延迟、高并发的企业生产场景。

API 上线 BigModel.cn 开放平台,可以一键兼容 Claude Code 框架。

我深度体验了z.ai官网上GLM-4.5的「Full-Stack」全栈模式,这个功能绝对是开发者和创新者的福音,它类似于Lovable、Bolt.new等平台,但集成度更高,体验更流畅。

这个功能类似于Lovable、Bolt.new的功能。

在与GLM-4.5的对话过程中,它不仅能生成具有设计美学的前端页面,更能同时生产前后端并存的完整页面,甚至可以直接连接数据库、实现用户交互、数据存储等功能。

最终,只需简单操作,就可以将完整的应用直接部署发布到公网,真正实现“创意即部署”。

做一个共享功德箱, 点击+1点功德 , 保存到数据库在写一个管理员页面的功能, 可以手动编辑修改这个总功德数

同时,它还能为您编写一个管理员页面,管理员可以通过这个页面手动编辑修改总功德数。GLM-4.5能够理解并一步到位地完成整个开发流程,从前端UI到后端逻辑,再到数据库交互和部署,极大地缩短了开发周期。

写在最后

智谱此次发布的全新GLM-4.5模型,通过其创新性地把推理、代码、Agentic等多能力原生融合,在多个基准测试中取得了令人瞩目的成绩,无疑为AI领域注入了新的活力。

更重要的是,其API使用具有低成本和高速度的显著优势,这对于需要低延迟、高并发的企业级场景来说,是不可多得的解决方案。可以预见,未来会有更多的企业和个人开发者选择GLM-4.5来赋能业务创新,加速产品落地。

Agent 轨迹:

https://huggingface.co/datasets/zai-org/CC-Bench-trajectories

特别是在当前一些通用智能体使用成本居高不下,普通人难以广泛使用的情况下,GLM-4.5完美解决了模型能力与成本之间的平衡问题。

它在保证强大能力的同时,将成本大幅压低,并显著提高了任务执行效率,这对于创业者、中小企业乃至大型科技公司来说,都是巨大的利好!它让AI的触手可及,让创新不再受高昂成本的束缚。

GLM-4.5的发布,不仅仅是一款模型的升级,更是对未来AI应用模式的一次大胆探索和成功实践。它正在开启一个全民皆可开发智能应用的新时代。

欢迎大家关注我,一起交流学习,共同探索GLM-4.5的无限可能!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OE7TZBshlIVoCPGYkZEtmHug0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券