首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】ULTRAINTERACT - 推动复杂推理任务的大规模对齐数据集

ULTRAINTERACT是清华大学、面壁智能、腾讯等知名机构针对复杂推理任务联合构建的一个大规模、高质量的对齐数据集。该数据集涵盖了数学、编程和逻辑推理等多个领域,共包含86,000条指令和220,000个动作对构成,其中每条指令均配有偏好树结构,包含多样化的推理策略、多轮交互轨迹以及成对的正确与错误行动数据。ULTRAINTERACT的设计强调复杂问题的解决能力,要求模型具备规划、推理、工具整合以及与环境和用户互动学习的能力。该数据集既可用于监督式微调,也可用于偏好学习,显著提升了开源模型在复杂推理任务上的性能。

详情请参见五号雷达:https://www.5radar.com/result?key=ULTRAINTERACT

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OK-jJMSd9zMRWI_CMVOQ2IEg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券