蓝鲸新闻5月26日讯 5月26日,红杉中国宣布正式推出一款全新的AI基准测试工具xbench。红杉中国称,在评估和推动AI系统提升能力上限与技术边界的同时,xbench会重点量化AI系统在真实场景的效用价值,并采用长青评估的机制,去捕捉Agent产品的关键突破。过去两年多,xbench一直是红杉中国在内部使用的跟踪和评估基础模型能力的工具。在国内AI创企中,红杉中国投资了包括智谱AI、月之暗面、Manus母公司在内的一众明星公司。(蓝鲸新闻 朱俊熹)
分享快讯到朋友圈