首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

马斯克 xAI 推出 Grok-1.5 大语言模型,128k上下文轻松处理

3月29日,马斯克旗下人工智能公司 xAI 在官方博客中宣布,正式推出 Grok-1.5 大语言模型。

Grok-1.5 以增强的推理功能及长达128k的上下文处理能力为显著特点,特别是在编码和数学任务上的性能有了大幅提升。

据悉,Grok-1.5将在近日向早期测试人员及现有Grok用户逐步开放,在平台上提供试用。在官方公布的测试结果中,Grok-1.5在MATH基准测试中取得了50.6%的优异成绩,同时在更具挑战性的GSM8K基准上也达到了90%的高分。这两个基准测试广泛覆盖了从小学到高中阶段的数学问题。此外,Grok-1.5还在HumanEval基准测试中表现出色,得分为74.1%,充分展现了其代码生成与问题解决的实力。

值得一提的是,Grok-1.5在处理长文本方面也有显著进步,其上下文窗口可容纳高达128k的tokens,这是前一代模型内存容量的16倍,为用户理解长篇幅文档提供了更强大的支持。

技术层面,Grok-1.5的构建基于JAX、Rust以及Kubernetes等先进技术打造的定制化分布式训练框架。该框架配备了智能训练协调器,能够实时检测并排除问题节点,确保训练过程的顺利进行。同时,xAI还对检查点、数据加载及训练重启等关键环节进行了优化,以在发生故障时最大限度地减少停机时间,提升整体系统的稳定性和效率。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OCk14Bc_3jF48763L9Yxw1Ag0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券