首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

苏州大学推出开源大模型 OpenBA,具备150亿参数

据品玩 9 月 22 日报道,据 Arxiv 页面显示,来自苏州大学的一个研发团队近日推出一款名为 OpenBA 的开源 seq2 seq 模型。

据悉,OpenBA 是一款具有 150 亿参数的双语非对称 seq2 seq 模型,也是首个加入中国开源模型社区的大语言模型变体。论文显示,研究者采用高效的技术以及采用三阶段的训练策略,从头开始训练了 OpenBA 模型。

实验显示,OpenBA 在 BELEBELE 基准测试中的性能优于 LLaMA-70 B,在 MMLU 基准测试中的性能优于 BLOOM-176 B,在 C-Eval(hard)基准测试中的性能优于 GLM-130 B。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O088Ix3V7CfiyoUCUbHIlMVQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券