2025年,大语言模型(LLM)的竞争焦点已从单纯的对话质量,转向了复杂任务执行与工程化落地能力。市场更关注模型能否真正“把活干完”,尤其是在软件工程、数据分析、自动化办公等场景中,模型需要能够理解需求、拆解任务、调用工具并修正错误,直至任务完成。
GLM-4.7 正是智谱AI在这一背景下推出的新一代旗舰模型,于2025年12月23日发布并开源。它并非简单的参数升级,而是一次面向“Agentic Coding”和“复杂推理”的系统性跃迁,旨在将模型从“答得对”推向“做得完”。
本文将围绕GLM-4.7展开,深入探讨其技术架构、能力评测、推理机制、Agent应用、部署实践及产业影响,旨在为读者提供一个全面、深入的理解框架。
GLM-4.7在发布当日即通过BigModel.cn开放API,并上线z.ai全栈开发模式的Skills模块。其开源策略迅速获得了全球开发者的积极响应,在Hugging Face全球趋势榜上登顶,并被Vercel、Kilo Code、Cline等多个海内外平台宣布接入。
智谱AI自2019年成立以来,始终专注于通用人工智能(AGI)研究。GLM-4.7是其GLM-4系列的重要升级,标志着该系列从通用对话模型向“工程化Agent基石模型”的演进。2026年1月8日,智谱AI在香港联交所主板上市(股票代码:2513),GLM-4.7被视为其技术实力的关键体现。
GLM-4.7的快速发展得益于完善的生态系统和产业支持。其架构已适配40余款国产芯片,并与北京市公共算力平台等合作,为模型训练提供了坚实基础。
GLM-4.7延续了GLM系列的自回归Transformer架构,并针对编程和推理任务进行了深度优化。其核心是混合专家(MoE)架构,通过门控网络将输入分配给不同的“专家”子网络,在保持强大能力的同时有效控制了推理成本。
GLM-4.7支持约200K的输入上下文和128K的输出长度,这一特性对于处理长文档、分析大型代码库和执行多步骤的复杂任务至关重要,为Agent的“长链路执行”提供了可能。
GLM-4.7定位为文本大模型,其强大的视觉理解能力主要由GLM-4V系列模型承担。在z.ai平台,GLM-4.7作为“决策大脑”,负责理解用户意图、规划任务流程,并协同调度GLM-4V(视觉)、ASR(语音识别)、TTS(语音合成)等多模态能力,实现统一的多模态任务规划与协作。
GLM-4.7的训练不仅依赖于大规模的预训练和指令微调,更引入了基于可验证奖励的强化学习(RLVR)框架Slime。该框架将任务执行、结果验证、奖励计算和策略更新整合成一条自动化的工程流水线,持续打磨模型在复杂任务中的表现。
GLM-4.7在多个权威编码基准测试中表现卓越,被誉为“国产开源编程天花板”。
GLM-4.7在数学和复杂推理方面同样表现出色,在多项高难度测试中达到或接近顶尖水平。
GLM-4.7在工具调用和多步交互任务中表现突出,是构建高效Agent的关键。
在Artificial Analysis Intelligence Index榜单中,GLM-4.7以68分的综合成绩位列全球第六,同时在开源模型和国产模型分类中均排名第一,超越了Claude 4.5 Sonnet、Grok 4等国际知名模型。
GLM-4.7在前端代码生成和UI设计方面取得了显著进步,能够生成观感更佳的网页和PPT。
GLM-4.7将“思考过程”作为模型输出的一部分进行显式建模,通过“先思考,再行动”的模式,显著提升了复杂任务的稳定性和可控性。
在每次生成回答或调用工具前,模型都会先生成一段推理轨迹(Thought Trace),用于规划、验证和反思。这一机制有效减少了“幻觉调用”和参数错误。
在多轮对话的复杂任务中,模型会自动保留之前的思考模块,避免重复推理,确保长程任务的一致性和效率。
用户可以根据任务的复杂度,按“轮”控制模型的推理开销。简单任务可关闭思考模式以降低延迟和成本,复杂任务则开启思考模式以确保质量。
思考模式 | 核心机制 | 主要优势 | 适用场景 |
|---|---|---|---|
交织式思考 | 在每次行动前生成推理轨迹 | 减少错误调用,提升规划质量 | 所有需要推理的任务 |
保留式思考 | 跨多轮对话保留思考结果 | 避免重复推理,保障长程一致性 | 长周期复杂工程任务 |
轮级思考 | 按对话轮次控制推理开关 | 灵活平衡性能与成本 | 混合复杂度的工作流 |
这些思考模式使GLM-4.7能够胜任复杂的Agent工作流,如多步工具调用、长程规划和自我修正,真正从“聊天机器人”进化为“任务执行者”。
GLM-4.7在“Agentic Coding”场景中表现卓越,能够胜任从零构建项目和在现有工程中迭代优化的全流程任务。
在z.ai平台,GLM-4.7作为“总指挥”,能够理解包含文本、图像、语音的多模态指令,并协同调度视觉、语音等多种能力,完成跨模态的复杂任务。
智谱的AutoGLM 2.0应用了GLM-4.7的Agent能力,通过“API+GUI”混合模式,能在移动设备上执行长达40步的复杂操作,如自动查询攻略、比价下单等,已覆盖约8000万台终端。
GLM-4.7正被广泛应用于电商、金融、工业等多个行业,用于构建智能客服、自动化测试、代码审计等Agent应用,有效提升了业务效率和质量。
开发者可通过智谱AI的BigModel.cn平台或z.ai全栈开发模式调用GLM-4.7。其API接口兼容OpenAI格式,并支持通过extra_body参数精细控制思考模式等高级功能。
GLM-4.7支持通过vLLM、SGLang等主流推理框架进行本地或私有化部署,便于企业在自有环境中使用。
为充分发挥GLM-4.7的能力,建议根据具体任务调整参数:
temperature: 0.7top-p: 1.0max_new_tokens: 16384temperature: 1.0top-p: 0.95max_new_tokens: 131072GLM-4.7在多个国际权威评测中取得开源与国产双料第一的成绩,标志着中国大模型技术已跻身全球第一梯队,具备了与国际顶尖模型同台竞技的实力。
GLM-4.7的开源和广泛应用,正在推动AI从“实验室Demo”走向“生产级应用”。其高性价比的API服务和强大的Agent能力,为中小企业提供了低成本、高效率的智能化转型方案。
GLM-4.7已适配40余款国产芯片,并在国产算力平台上完成训练,为我国在AI领域实现技术自主可控奠定了坚实基础。
GLM-4.7将推动AI Agent在更多行业和应用场景中的普及,从软件开发、办公自动化,到智能制造、智慧城市,深刻改变人机协作的方式。