首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

海天瑞声发布超大规模中文对话数据集 DOTS-NLP-216

据金十 7 月 28 日报道,海天瑞声今日宣布正式推出中文千万轮对话语料库 DOTS-NLP-216。据介绍,该语料库更加符合中国人表达习惯的自然对话数据集,共计约千万轮,上亿级 token,包含正式 & 非正式风格对话,使用偏口语化自然表达,覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上,DOTS-NLP-216 包含了对真实场景的对话采集,及高度还原真实场景的模拟对话两种方式。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oj37DBlU6IeiVe9p5GgOJEow0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券