首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】OpenToM - 心智理论评估数据集

OpenToM是伦敦国王学院和华为伦敦研究中心等提出的一个评估大模型心智理论的新基准。其特点包括:长且清晰的叙事、性格鲜明的角色、基于角色意图的行动,以及旨在挑战大语言模型在模拟角色心理状态方面能力的问题。该基准库包含696个叙述,其中596个为标准长度(平均194.3个单词),100个为长篇(平均491.6个单词),每个叙述后附有23个心智问题,总计16008个。OpenToM数据集为心智研究提供了可靠的评估基准,对心智模型的开发与优化具有重要意义。

详情请参见五号雷达:

https://www.5radar.com/

数据集地址:

https://github.com/seacowx/OpenToM

https://huggingface.co/datasets/SeacowX/OpenToM

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OOWDS8dnxZ7Ty4ot7minqgMw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券