1月29日,王小川创立的百川智能,发布超千亿参数的大语言模型Baichuan 3。
据介绍,Baichuan 3部分能力在多个权威通用能力测评中超过或逼近GPT-4。如在CMMLU、GAOKAO、HumanEval和MBPP等多个中文评测榜单上,超越GPT-4;在MT-Bench、IFEval等对齐榜单的评测中,Baichuan 3超越了GPT-3.5、Claude等大模型。
在1月9日,百川智能还发布了角色大模型Baichuan-NPC。据介绍,Baichuan-NPC深度优化了“角色知识”和“对话能力”,使模型能够更好地理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色栩栩如生。
在去年12月,百川智能开放基于搜索增强的Baichuan2-Turbo系列API,结合RAG和向量数据库两条路线,打出了一套“大模型+超长上下文窗口+搜索增强知识库”的组合拳。
在接受媒体采访时,王小川给出了自己的论断:“大模型+搜索增强是大模型时代的新计算机,大模型类似于计算机的CPU,互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘”。据王小川介绍其在10月30日发布的Baichuan-192K大模型的上下文窗口长度为当时全球最长,能够一次性输入35万汉字。
综合自百川智能、新京报
领取专属 10元无门槛券
私享最新 技术干货