首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Databricks 推出大语言模型 DBRX,号称“现阶段最强开源 AI”

IT之家 3 月 31 日消息,Databricks 近日在推出了一款通用大语言模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。

IT之家从官方新闻稿中得知,DBRX 是一个基于 Transformer 的大语言模型,采用 MoE(Mixture of Experts)架构,具备 1320 亿个参数,并在 12T Token 的源数据上进行预训练。

研究人员对这款模型进行测试,相较于市场上已有的 LLaMA2-70B、Mixtral、Grok-1 等开源模型,DBRX 在语言理解(MMLU)、程式设计(HumanEval)及数学逻辑(GSM8K)等基准测试上的表现较为突出。官方同时提到,DBRX 在上述 3 项基准测试中也超越了 OpenAI 的 GPT-3.5。

Databricks AI 部分副总裁 Naveen Rao 向外媒 TechCrunch 透露,该公司花了两个月及 1000 万美元的成本来训练 DBRX,虽然目前 DBRX 在整体成绩方面发挥较好,不过目前该模型需要使用 4 块英伟达 H100 GPU 运行,因此还有待优化空间。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Ojhwv-E4SuWlatmHBakLXOVA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券