首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

体验 | GLM-4成功避坑,欢迎体验

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区将努力打造成huggingface之外最活跃的中立开放的AI开源社区。“源享计划”即开源共享计划,各类开源模型、数据集、代码等,欢迎发布到wisemodel.cn社区。wisemodel社区持续招募志愿者,欢迎通过《加入wisemodel社区志愿者团队》了解详情。

近期智谱AI的GLM-4模型API正式开放,始智AI wisemodel.cn开源社区也上线了GLM-4的API体验。大家可以通过始智AI的开放平台(wisemodel.cn)的体验空间来体验。欢迎各位开发者和人工智能爱好者加入我们wisemodel的开源社区,一起探索GLM-4模型的强大功能。

一、GLM-4

新一代基座大模型GLM-4,整体性能相比GLM3全面提升60%,逼近GPT-4;支持更长上下文;更强的多模态;支持更快推理速度,更多并发,大大降低推理成本;同时GLM-4增强了智能体能力。这一模型在自然语言处理(NLP)领域具有多项突破性技术,能够提供更加精准、高效的语言理解和生成能力。GLM-4模型的设计旨在更好地理解和生成自然语言,从而在各种应用场景中提供支持,包括但不限于文本生成、机器翻译、情感分析等。

基础能力(英文):GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等数据集上,分别达到GPT-4 94%、95%、91%、99%、90%、100%的水平。

指令跟随能力:GLM-4在IFEval的prompt级别上中、英分别达到GPT-4的88%、85%的水平,在Instruction级别上中、英分别达到GPT-4的90%、89%的水平。

对齐能力:GLM-4在中文对齐能力上整体超过GPT-4。

长文本能力:在LongBench(128K)的相关评测中,数据显示,GLM-4性能超过 Claude 2.1;在「大海捞针」(128K)实验中,GLM-4的测试结果为 128K以内全绿,做到100%精准召回。

GLM-4内测数据表现惊艳:在内测阶段,首批体验 GLM-4 模型API的开发者表现出极高的热情,调用次数逐日快速递增,开发者们对 GLM-4 模型的推理效果和性能给予高度评价。

GLM-4 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型,以完成复杂任务。

简单来讲,即只需一个指令,GLM-4会自动分析指令,结合上下文选择决定调用合适的工具。

二、wisemodel上GLM-4的有趣体验

考一考GLM-4:“林黛玉倒拔垂杨柳的典故听说过吗?”GLM-4的回答还是挺好的,没有掉坑里。

GLM-3-turbo的回答开始掉坑里了,但后面的回答还是自己纠正了一下。

但GLM3-6B的模型就没有那么强的表现了,直接掉坑里去了。

在日常生活中突发奇想,在GLM-4上一搜索就能知道。

在学习上遇到问题,找GLM-4帮忙

生活上需要帮助,GLM-4也能迅速给你答案

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OQixoVxegc9ZEFLkS02liBuw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券