声音识别的ImageNet诞生,谷歌发布大规模音频数据集

【新智元导读】谷歌今天发布了一个在声音识别上对标图像识别领域中的ImageNet的大型数据库。包含2100万标注视频、5800个小时的音频、527种类型的标注声音。

谷歌机器感知研究小组(Machine Perception Research)最新发布了一个大规模的音频数据集AudioSet。

根据谷歌在官网的介绍,AudioSet 包括 632 个音频事件类的扩展类目和从YouTube视频绘制的 2,084,320 个人类标记的10秒声音剪辑的集合。类目被指定为事件类别的分层图,覆盖广泛的人类和动物声音,乐器和风格以及常见的日常环境声音。

发布者写道:通过发布AudioSet,我们希望为音频事件检测提供一个常见的,现实层面的评估,同时开始提供一个全面的声音事件词汇表。

数据量:2100万标注视频、5800个小时的音频、527个类型的标注声音

数据例子:

声音识别领域的ImageNet

音频事件识别在机器感知中是一个新出现的难题,它的目标是让机器具备像人一样能从音频中识别并关联声音的能力。类似的问题,如图像中的对象检测,已经从大型数据集(主要是ImageNet)中获得了巨大的收益。

本文介绍了AudioSet的创建,这是一个手动注释音频事件的大规模数据集,努力弥合图像和音频研究之间数据可用性的差距。使用由文献和手动策划指导的635个音频类的精心构造的分层类目,我们收集来自人类标签器的数据,探测在10秒段的YouTube视频中特定音频类的存在。提出了使用基于元数据,上下文(例如,链接)和内容分析的搜索来标记。结果获得了覆盖范围和大小都前所未有的数据集,我们希望这能大大提高高性能音频事件识别器的开发。

更多详情,见论文https://research.google.com/pubs/archive/45857.pdf

如何使用数据库:https://research.google.com/audioset/

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-03-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏智能算法

关于车牌识别过程中的工作流程框架分析

车辆检测跟踪模块   车辆检测跟踪模块主要对视频流进行分析,判断其中车辆的位置,对图像中的车辆进行跟踪,并在车辆位置最佳时刻,记录该车辆的特写图片,由于加入了跟...

40970
来自专栏机器之心

专访 | 追一科技首席科学家杨振宇:对话机器人里不能「耳闻目览」却又「无所不在」的 AI

机器之心原创 作者:邱陆陆 对话机器人是「怎样炼成的」。 相比于语音和图像,自然语言是一个有「更多需求」和「更少标准答案」的领域。扎根自然语言的公司通常也不是从...

40590
来自专栏ATYUN订阅号

Salesforce开发了一个处理不同NLP任务的通用模型

自然语言处理(NLP)的技术可以帮助计算机解释人类语言,能够带来令人惊讶的细微差别。其中一个例子就是Facebook新推出的页面NLP集成,它可以自动从企业的...

11930
来自专栏新智元

谷歌用“多巴胺”怼上OpenAI,开源TensorFlow强化学习框架

最近 OpenAI 在 Dota 2 上的表现,让强化学习又大大地火了一把,但是 OpenAI 的强化学习训练环境 OpenAI Gym 却一直遭到不少抱怨,比...

46930
来自专栏PPV课数据科学社区

读书笔记 |《推荐系统实践》- 个性化推荐系统总结

? 推荐系统实践 对于推荐系统,本文总结内容,如下图所示: ? 推荐系统.png 文章很长,你可以跳着看你感兴趣的部分。 一、什么是推荐系统 1. 为什么需要...

666110
来自专栏CDA数据分析师

4个步骤,构建一个有指导的数据挖掘模型

数据挖掘的目的,就是从数据中找到更多的优质用户。什么是有指导的数据挖掘方法模型,以及数据挖掘如何构建模型。在构建一个有指导的数据挖掘模型,首先要理解和定义一些模...

397100
来自专栏数据派THU

独家 | 一文读懂推荐系统知识体系-下(评估、实战、学习资料)

? 本文主要阐述: 推荐系统的评估(Evaluation) 推荐系统的冷启动问题(Cold Start) 推荐系统实战(Actual Combat) 推荐系统...

2.5K70
来自专栏QQ大数据团队的专栏

手Q游戏中心的个性化推荐实战

自手Q游戏中心V6.0改版以来,产品形态发生了较大的转变,不再是纯粹通过app列表做游戏分发,而是试图通过内容来带游戏分发,全新的产品形态给推荐算法带来了许多的...

1.2K90
来自专栏人工智能头条

TalkingData大规模机器学习的应用

21240
来自专栏一名叫大蕉的程序员

Machine Learning最小可迭代产品No.75

报告各位首长,我参与的第二个项目顺利上线啦~ 棒棒,又一次感觉自己做的东西是有价值的,这个项目是一个平台类产品,专注于提高线下零售的实施效率,希望后面的迭代会越...

22180

扫码关注云+社区

领取腾讯云代金券