首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

百川智能推出 Baichuan2-192K 大模型,号称全球最长上下文窗口

IT之家 10 月 30 日消息,百川智能今日宣布推出 Baichuan2-192K 大模型。据介绍,该模型上下文窗口长度达 192K,能够处理约 35 万个汉字,号称是目前全球最长的上下文窗口。

百川智能表示,Baichuan2-192K 是目前支持长上下文窗口最优秀大模型 Claude2(100K 上下文窗口,实测约 8 万字)的 4.4 倍,是 GPT-4(支持 32K 上下文窗口,实测约 2.5 万字)的 14 倍。

IT之家注:上下文窗口长度是大模型的核心技术之一,通过更大的上下文窗口,模型能够结合更多上下文内容获得更丰富的语义信息,更好地捕捉上下文的相关性、消除歧义,进而更加准确、流畅地生成内容,提升模型能力。

Baichuan2-192K 在 Dureader、NarrativeQA、LSHT、TriviaQA 等 10 项中英文长文本问答、摘要的评测集上表现良好,有 7 项取得 SOTA。

百川智能表示,Baichuan2-192K 将以 API 调用和私有化部署的方式提供给企业用户,目前百川智能已启动 Baichuan2-192K 的 API 内测,开放给法律、媒体、金融等行业的核心合作伙伴。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Ot3acMWfdYmETWSPIJbPxQlw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券