首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】Audio Dialogues - 促进音频与音乐理解的多轮对话数据集

Audio Dialogues是英伟达构建的一个多轮对话数据集,旨在提升音频和音乐理解能力。数据集包含163.8K个样本,涵盖通用声音和音乐,除了对话外,该数据集还包括问题-答案对,以理解和比较多个输入音频。该数据集通过基于提示的方法和大型语言模型生成,研究人员首先从AudioSet和MusicCaps这两个数据集中获取音频的注释,然后使用GPT-4模型根据这些注释生成多轮对话。Audio Dialogues的推出,为音频理解领域的研究提供了宝贵的资源,可用于训练和评估音频增强的大型语言模型。

详情请参见五号雷达:https://www.5radar.com/result?key=Audio+Dialogues

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OQP7Nw2tj7m0NvPEbvaU_h6w0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券