首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

智谱推新开源AI模型GLM-4-32B-0414系列 包含320亿参数

【太平洋科技快讯】近日,智谱发布了新一代开源AI模型GLM-4-32B-0414系列,共有 GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414 四款模型,包含320亿参数。

GLM-4-32B-Base-0414:

采用15T高质量数据预训练,包含大量推理类合成数据。后训练阶段通过拒绝采样和强化学习等技术,强化了指令遵循、工程代码、函数调用等方面的能力。在工程代码、Artifacts生成、函数调用、搜索问答及报告等方面表现优异,部分Benchmark甚至可媲美更大规模的模型。

GLM-Z1-32B-0414:

在基础模型上通过冷启动和扩展强化学习,以及在数学、代码和逻辑等任务上的进一步训练,显著提升了数理能力和解决复杂任务的能力。

GLM-Z1-Rumination-32B-0414:

具有沉思能力的深度推理模型,对标OpenAI的Deep Research。通过更长时间的深度思考解决开放性和复杂问题,结合搜索工具处理复杂任务。

GLM-Z1-9B-0414:

开源的9B小尺寸模型,在数学推理和通用任务中表现优秀,处于同尺寸开源模型的领先水平。

在IFEval指令遵循测试中,GLM-4-32B-0414得分87.6;TAU-Bench任务自动化测试中,零售场景得分68.7,航空场景得分51.2;SimpleQA搜索增强问答测试中,得分88.1;SWE-bench代码修复测试中,成功率达33.8%。此外,GLM-4系列模型采用MIT许可,降低了计算成本,为研究和企业提供了高性能AI解决方案。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OMMRJJuOc-trDJg-ZSlQu3zQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券