首页
学习
活动
专区
圈层
工具
发布

投资机构红杉中国发布AI基准测试xbench,首次公开内部评测工具

蓝鲸新闻5月26日讯 5月26日,红杉中国宣布正式推出一款全新的AI基准测试工具xbench。红杉中国称,在评估和推动AI系统提升能力上限与技术边界的同时,xbench会重点量化AI系统在真实场景的效用价值,并采用长青评估的机制,去捕捉Agent产品的关键突破。过去两年多,xbench一直是红杉中国在内部使用的跟踪和评估基础模型能力的工具。在国内AI创企中,红杉中国投资了包括智谱AI、月之暗面、Manus母公司在内的一众明星公司。(蓝鲸新闻 朱俊熹)

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OIwfWPzWdHqUTjMz47v0IuCA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券