首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

王小川创立的百川智能发布千亿大模型

1月29日,王小川创立的百川智能,发布超千亿参数的大语言模型Baichuan 3。

据介绍,Baichuan 3部分能力在多个权威通用能力测评中超过或逼近GPT-4。如在CMMLU、GAOKAO、HumanEval和MBPP等多个中文评测榜单上,超越GPT-4;在MT-Bench、IFEval等对齐榜单的评测中,Baichuan 3超越了GPT-3.5、Claude等大模型。

在1月9日,百川智能还发布了角色大模型Baichuan-NPC。据介绍,Baichuan-NPC深度优化了“角色知识”和“对话能力”,使模型能够更好地理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色栩栩如生。

在去年12月,百川智能开放基于搜索增强的Baichuan2-Turbo系列API,结合RAG和向量数据库两条路线,打出了一套“大模型+超长上下文窗口+搜索增强知识库”的组合拳。

在接受媒体采访时,王小川给出了自己的论断:“大模型+搜索增强是大模型时代的新计算机,大模型类似于计算机的CPU,互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘”。据王小川介绍其在10月30日发布的Baichuan-192K大模型的上下文窗口长度为当时全球最长,能够一次性输入35万汉字。

综合自百川智能、新京报

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OKxLANQoxZv-cq8ZCiA24EUA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券