始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区,始终坚持“中立、开放、共建、共创、合作”五项基本原则,欢迎加入共同成长。
GLM-4.7-Flash是一个混合思考模型,总参数量为30B,激活参数量为3B,作为同级别SOTA模型,为轻量化部署提供了一个兼顾性能与效率的新选择。GLM-4.7-Flash于1月20日正式发布并开源,同时发布到了始智AI wisemodel开源社区,感兴趣的欢迎前往了解详情。
模型地址:
https://wisemodel.cn/models/ZhipuAI/GLM-4.7-Flash
* *
小而强
在SWE-bench Verified、τ²-Bench等主流基准测试中,GLM-4.7-Flash的综合表现超过gpt-oss-20b、Qwen3-30B-A3B-Thinking-2507,在相同和近似尺寸模型系列中取得开源SOTA分数。
在内部的编程实测中,GLM-4.7-Flash在前、后端任务上表现出色。在编程场景之外,我们也推荐大家在中文写作、翻译、长文本、情感/角色扮演等通用场景中体验GLM-4.7-Flash。
关于GLM-4.7-Flash的本地部署,基于vllm和transformers发布的版本暂时还是会报错,直接从源码安装可以运行,欢迎大家尝试或者等发布版本之后再进行部署。