大家好,我是绛烨。
昨天晚上智谱发布开源了他们家新的旗舰模型GLM4.5,一款专为智能体应用打造的智能体基座模型。
看到身边很多开发者都在讨论这个,都说代码能力非常优秀。
本次智谱开源的GLM-4.5模型,在综合性能SOTA、更高的参数效率、低成本和高速度方面有很多值得看的点。
综合性能SOTA
之前的智能体里面的模型,要么是分为functionCall、代码、对话、Thinking模型,一个模型很难兼容这么多的能力,需要根据不同的场景选择不同的模型。
而现在,模型更加聪明了。
GLM-4.5是首个在单个模型中实现了推理、代码、智能体等多能力原生融合,适配从对话生成到智能体任务的多类场景。
这种融合多种能力之后的通用基座模型,能力丝毫不弱于其他模型,并且在多个评测基准里面取得领先的成绩。
综合评估下来,GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。
性能表现怎么样?
GLM-4.5作为原生Agentic基座模型,可以胜任全栈开发任务,编写各种应用、游戏、交互网页。
比如可以用它做一个3D 交互式地球网页。
创建一个3D网页,展示一个简化的太阳系模型。页面中央是太阳(可发光效果),周围环绕着3-5个简化的行星(不同大小、颜色)。用户可以用鼠标拖拽来旋转整个太阳系视图。点击某个行星时,视角会聚焦到该行星,并弹出一个小框显示行星名称和一段简短的介绍(例如:‘火星:红色星球’)。
体验:https://chat.z.ai/space/x07bt6z0m6d0-art
还可以用它制作非常好玩的游戏。
制作一个基于网页的3D冥想空间。场景为一个开放的、漂浮着抽象粒子或几何体的空间。用户可以播放(或模拟播放)一段背景音乐。空间中的粒子或几何体应随着音乐的节奏和音量变化而动态地跳动、闪烁或变换颜色。玩家可以自由旋转视角,感受空间的变化。
体验:https://chat.z.ai/space/p0bbx62yabm1-art
当然它也可以是打工人的省心搭子,可以用它制作PPT或者图文卡片,它会自主搜索资料、寻找配图,根据实际材料直接以HTML形式编写图文,从而使信息更准确、排版更灵活。
向下滑动查看所有内容
创作3张低饱和的书签,用墨、金墨及国画颜料中的钛白和朱砂进行装饰性书写,内容为诗句:
图1:他皆携酒寻芳去,我独关门好静眠。
图2:双扉昼掩薛萝深,一榻清风太古心。
图3:冰雪林中著此身,不同桃李混芳尘。
制作一个Xbox 360控制器的SVG图像 。
除此之外,它也可以接入claude code,直接调用API即可,目前它已经兼容了 Anthropic API 。
更高的参数效率
GLM-4.5模型使用了更加高效的参数效率,也就是说,模型参数比DeepSeek-R1和Kimi-K2更低,模型能力在多个基准测试榜单上表现的更加出色。
在相同规模参数的模型下,GLM-4.5 系列实现了最佳性能,这一点可以从衡量模型代码能力的 SWE-bench Verified 榜单排名可以看到,GLM-4.5 系列位于性能/参数比帕累托靠前的位置。
低成本、高速度
除了上面介绍的参数优化之外,GLM-4.5系列模型也极大的降低了模型的使用成本。
目前API调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens,简直就是白菜价。
除了这种低成本的优势之外,模型生成的速度也非常快,超过 100 tokens/秒,支持低延迟、高并发的企业生产场景。
API 上线 BigModel.cn 开放平台,可以一键兼容 Claude Code 框架。
我深度体验了z.ai官网上GLM-4.5的「Full-Stack」全栈模式,这个功能绝对是开发者和创新者的福音,它类似于Lovable、Bolt.new等平台,但集成度更高,体验更流畅。
这个功能类似于Lovable、Bolt.new的功能。
在与GLM-4.5的对话过程中,它不仅能生成具有设计美学的前端页面,更能同时生产前后端并存的完整页面,甚至可以直接连接数据库、实现用户交互、数据存储等功能。
最终,只需简单操作,就可以将完整的应用直接部署发布到公网,真正实现“创意即部署”。
做一个共享功德箱, 点击+1点功德 , 保存到数据库在写一个管理员页面的功能, 可以手动编辑修改这个总功德数
同时,它还能为您编写一个管理员页面,管理员可以通过这个页面手动编辑修改总功德数。GLM-4.5能够理解并一步到位地完成整个开发流程,从前端UI到后端逻辑,再到数据库交互和部署,极大地缩短了开发周期。
写在最后
智谱此次发布的全新GLM-4.5模型,通过其创新性地把推理、代码、Agentic等多能力原生融合,在多个基准测试中取得了令人瞩目的成绩,无疑为AI领域注入了新的活力。
更重要的是,其API使用具有低成本和高速度的显著优势,这对于需要低延迟、高并发的企业级场景来说,是不可多得的解决方案。可以预见,未来会有更多的企业和个人开发者选择GLM-4.5来赋能业务创新,加速产品落地。
Agent 轨迹:
https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
特别是在当前一些通用智能体使用成本居高不下,普通人难以广泛使用的情况下,GLM-4.5完美解决了模型能力与成本之间的平衡问题。
它在保证强大能力的同时,将成本大幅压低,并显著提高了任务执行效率,这对于创业者、中小企业乃至大型科技公司来说,都是巨大的利好!它让AI的触手可及,让创新不再受高昂成本的束缚。
GLM-4.5的发布,不仅仅是一款模型的升级,更是对未来AI应用模式的一次大胆探索和成功实践。它正在开启一个全民皆可开发智能应用的新时代。
欢迎大家关注我,一起交流学习,共同探索GLM-4.5的无限可能!