智谱官宣正式发布并开源新一代大模型 GLM-4.6,代码能力较GLM-4.5提升27%。智谱称,GLM-4.6已在寒武纪领先的国产AI芯片上实现FP8+Int4混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4模型-芯片一体化解决方案。与此同时,摩尔线程基于vLLM推理框架完成对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型。
分享快讯到朋友圈