首页
学习
活动
专区
圈层
工具
发布

寒武纪与摩尔线程完成对智谱GLM-4.6 的适配

雷递网 乐天 9月30日

国产大模型与国产芯片协同进入新阶段。

智谱今日正式发布并开源新一代大模型 GLM-4.6,称在 Agentic Coding 等核心能力上实现大幅跃升。这是继 DeepSeek-V3.2-Exp 与 Claude Sonnet 4.5 之后,国庆节前业界的又一技术发布。

智谱称,在公开基准测试和真实编程任务中,GLM-4.6 的代码生成能力已全面对齐 Claude Sonnet 4,成为目前国内最强的 Coding 模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级,整体性能超越 DeepSeek-V3.2-Exp。

智谱官方宣布,GLM-4.6 已在寒武纪领先的国产 AI 芯片上实现 FP8+Int4 混合量化推理部署,这也是首次在国产芯片上投产的 FP8+Int4 模型-芯片一体化解决方案。在保持模型精度不变的前提下,该方案大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径和示范意义。

与此同时,摩尔线程基于 vLLM 推理框架完成对 GLM-4.6 的适配,新一代GPU可在原生FP8 精度 下稳定运行模型,验证MUSA 架构 及全功能GPU在生态兼容性和快速适配能力方面的优势。

智谱指出,寒武纪与摩尔线程完成对 GLM-4.6 的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的 AI 技术生态。

——————————————

雷递由媒体人雷建平创办,若转载请写明来源。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O2K3qoz_i_DlDjmQPX4Am9Pw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券