首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

昆仑万维:天工大模型在权威推理榜单Benchmark GSM8K 测试中大幅领先GPT-3.5

【昆仑万维:天工大模型在权威推理榜单Benchmark GSM8K 测试中大幅领先GPT-3.5】财联社10月19日电,昆仑万维在互动平台表示,天工AI助手的手机APP已开启内测。日前,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一;在权威推理榜单Benchmark GSM8K 测试中,天工大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),推理能力达到全球领先水平;此外,在基于SuperCLUE综合性测评基准,包括多轮开放式问题测评SuperCLUE-OPEN和三大能力客观题测评SuperCLUE-OPT的测试中,天工大模型文理兼顾,跻身中文闭源模型第一梯队。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O66d4EPB2Oq_RSMbnnkZabOw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券