专栏首页优图实验室的专栏优图动态|优图仅用两年刷新哼唱世界纪录,腾讯继续推动技术创新
原创

优图动态|优图仅用两年刷新哼唱世界纪录,腾讯继续推动技术创新

近日,腾讯优图团队在2015国际权威音频检索评测大赛MIREX中表现优异,在哼唱识别比赛中取得两个世界第一,两个世界第二的成绩。其中,在数据集IOACAS上,优图团队TOP10的命中率达到88.86%,超过了包括搜狗、音乐雷达、清华大学、网易云音乐、中国台湾大学等在内的历届强队,刷新哼唱识别世界纪录。

(数据来源:MIREX,表中数字为检索命中率)

MIREX(全称Music Information Retrieval EvaluationeXchange)由美国伊利诺依大学厄本那-香槟分校(UIUC)国际音乐信息检索系统评估实验(ISMIRSEL)主办。凭借其评估平台的公正性和可信性,已成为每年中音乐信息检索领域的一件盛事。

腾讯优图团队仅用两年的时间,就成功刷新了MIREX大赛世界纪录,主要得益以下三方面的持续积累及创新探索。

1. 前沿理论为技术实现提供了基础。腾讯优图与厦门大学纪荣嵘团队在哼唱识别领域展开了深度合作,纪教授的多项科研理论注入优图哼唱搜索算法以及MIREX评测系统中,夯实了技术研发的理论基础。

2. QQ音乐为技术落地提供了场景。优图团队在技术攻坚的同时联合QQ音乐,共同促成了哼唱识别功能的落地,在QQ音乐上创新性地推出哼唱识别功能,填补了QQ音乐在哼唱识别上的空白。在此之前,即使是像听歌识曲这样的找歌神器,也需要用户靠近正在播放歌曲的设备(即外部声源)才可发起识别。哼唱识别功能在QQ音乐上的落地实现,打破了市场单一的原声识别,在音频搜索的产品中位居业界领先的行列。上线以来,用户反响热烈,更引起微博上用户的热烈讨论。而AppStore上很多用户因哼唱功能的推出而纷纷点赞。

3. 多源曲库建设为技术创新提供了数据源泉。哼唱识别和原音识别不同,不仅要识别用户唱的什么,还要兼容不同用户哼唱的差异,这是哼唱识别最大的难点之一。传统的方法都是使用MIDI数据构建检索库,成本高且效果欠佳,优图创新地提出了基于清唱数据和MIDI数据的多源曲库建设技术,同时结合多参考检索技术,极大地提升了效果并降低了成本,成功解决了这个难题。另外,优图针对用户哼唱的特点,合理裁剪哼唱片段,减小用户之间的差异性,也进一步地提升了识别成功率。

除了哼唱识别,优图音频团队在原声识别领域的表现也十分出众。依托QQ音乐千万级别的海量曲库,结合优图团队强大的技术实力,原声识别达到了97%的准确率,抗噪性能和抗时间扭曲性能优异。优图后台基于用户行为构建冷热歌曲分级架构,设计柔性服务策略,保障高负载下的系统搞可用性,提升服务质量。在每天的请求量高达数千万级别的情况下,成功率仍能保持在99.99%的服务高质量水平。

QQ音乐哼唱识别

优图音频团队不仅在音乐分析上有很多成果,在数字识别和声纹识别等领域也有建树。现今互联网金融热火朝天,远程核身是一个重要的问题,主流的解决方案都是通过人脸识别解决;但是人脸识别存在活体识别的难题,结合多种生物验证手段提高攻击门槛成为一条合适的道路。优图在人脸识别达到世界第一的基础上,进一步结合数字识别技术和声纹识别技术,从声音的角度来验证身份。优图利用密码的随机性和声音的独特性来提升活体检测的效果,将远程核身的安全性提升了一个数量级。优图音频技术和图像技术一起作为双保险,保障用户的体验和合法权益。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大会活动|2019世界人工智能大会|视觉AI回归理性,腾讯优图加速产业数字化升级

    作为腾讯旗下顶级人工智能实验室之一,优图以计算机视觉技术为核心,专注人脸、人体、交通、医疗影像、自动驾驶等视觉领域的前沿研究和产品落地,为各行各业提供了超过15...

    优图实验室
  • 新闻动态|文青热来袭,优图人脸识别助力跨越时空重温五四

      黄景瑜撞脸徐志摩,杨子姗撞脸周璇……今天是五四青年节,在微博上杨紫、张一山、徐浩等等明星纷纷发了与自己撞脸的历史文艺青年对比图。原来,他们都在玩一款测算与历...

    优图实验室
  • 新闻动态 | 腾讯优图斩获IJCAI 2020挑战赛第一,首次提出卡通脸检测算法ACFD

    近日,在人工智能国际会议 (IJCAI) 举办的2020 iCartoonFace挑战赛中,腾讯优图实验室基于自研的“千寻”检测平台,首次提出面向动漫场景的卡通...

    优图实验室
  • 大会活动|2019世界人工智能大会|视觉AI回归理性,腾讯优图加速产业数字化升级

    作为腾讯旗下顶级人工智能实验室之一,优图以计算机视觉技术为核心,专注人脸、人体、交通、医疗影像、自动驾驶等视觉领域的前沿研究和产品落地,为各行各业提供了超过15...

    优图实验室
  • C语言进阶内置函数补充

    1、如果有足够空间用于扩大mem_address指向的内存块,则分配额外内存,并返回mem_address 。这里说的是“扩大”,我们知道,realloc是从堆...

    老九学堂-小师弟
  • gin框架之请求方法与路由分组

    大话swift
  • 那些年Struts 1.X 而今我还是不会

    struts1是WEB程序MVC分层架构中的C,属于控制层,主要进行处理用户的请求,基于请求驱动。 获取用户的请求地址并将表单中的数据封装到Form 对象后交给...

    小帅丶
  • Sqlilabs通关笔记(四)

    1.同理,本关的注入点在cookie参数,和上一关payload一样只是编码方式不同

    轩辕小子
  • 编程小白 | 每日一练(126)

    这道理放在编程上也一并受用。在编程方面有着天赋异禀的人毕竟是少数,我们大多数人想要从编程小白进阶到高手,需要经历的是日积月累的学习,那么如何学习呢?当然是每天都...

    闫小林
  • MySQL 性能优化技巧

    最近公司项目添加新功能,上线后发现有些功能的列表查询时间很久。原因是新功能用到旧功能的接口,而这些旧接口的 SQL 查询语句关联5,6张表且编写不够规范,导致 ...

    lyb-geek

扫码关注云+社区

领取腾讯云代金券