首页
学习
活动
专区
圈层
工具
发布

三星推出评估AI模型生产力的平台TrueBench

三星电子公司周四推出了一个旨在评估人工智能(AI)模型在工作环境中的生产力的平台。

这家韩国科技巨头在一份新闻稿中表示,这个名为TrueBench的平台将为企业提供一套全面的指标,以跟踪大型语言模型(LLM)在现实工作场所的生产力。

该公司表示:“最近,随着企业采用人工智能来完成任务,衡量LLM生产力的需求越来越大。然而,现有的基准主要衡量整体表现,大多以英语为中心,仅限于单轮问答结构。”

为了解决这些限制,三星表示,该平台评估与工作相关的任务,包括内容生成和数据分析,分为10个类别和46个子类别。

该服务支持韩语、英语、日语等12种语言。

三星电子设备体验事业部首席技术官Cheun Kyung-whoon表示:“三星研究院通过真实的人工智能经验,带来了深厚的专业知识和竞争优势”我们期待TrueBench能够建立生产力评价标准,巩固三星的技术领先地位。”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OgH3aQ7zaAP6rVqD2TRCTvSA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券