首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】MIntRec2.0 - 多模态意图识别对话数据集

MIntRec2.0是清华大学等提出的一个大规模多模态多方基准数据集,专门用于识别对话中的意图和检测非意图内容。相较于先前的MIntRec,MIntRec2.0的数据量增至15K,涵盖30种意图类别,并包含约9.3K个意图内及5.7K个意图外的标注语句,涉及文本、视频和音频等多种模态。该数据集由1,245个对话组成,每个对话平均12个语句,每个语句均配有意图标签,且每个对话至少涉及两位发言者,所有语句均标记发言者身份。此外,针对开放世界场景的需求,MIntRec2.0引入OOS标签,用于识别不属于已知意图类别的语句,以增强系统的鲁棒性。该数据集旨在促进多模态意图理解相关研究,为实现更自然的人机交互并通往AGI之路奠定坚实基础。

详情请参见五号雷达:https://www.5radar.com/

数据集地址: https://github.com/thuiar/MIntRec2.0

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OpCGEpaXoatoYr8D4tpI72pA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券