首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】JDocQA - 日语文档问答数据集

JDocQA是奈良先端科学技术大学院大学等机构联合构建的一个大规模日语文档问答数据集。该数据集包含5,504份PDF文档及11,600个日语标注的问答实例,每个问答实例都包括对文档页面的引用和答案线索的边界框。数据集涵盖了多种问题类别,包括是非题、事实题、数值题和开放式问题,且特别引入了无答案的问题。数据文档源自公共领域,如政府宣传册和网站,并通过人工注释问答对。JDocQA是一个高质量、实用的日语文档问答数据集,为研究者和开发者提供了一个评估和提升大模型在日语文档问答任务上性能的宝贵资源。

详情请参见五号雷达:https://www.5radar.com/result?key=JDocQA

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O-3b6rU8zciddvkwFKUesAvQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券