首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    人民大学提出听音识物AI框架,不用人工标注,嘈杂环境也能Hold住,还可迁移到物体检测

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI 不用人工标注,也能让AI学会听音寻物。 还能用在包含多种声音的复杂环境中。 比如这个演奏会视频,AI就能判断出哪些乐器在发声,还能定位出各自的位置。 这是中国人民大学高瓴人工智能学院最近提出的新框架。 对于人类而言,听音识物是一件小事,但是放在AI身上就不一样了。 因为视觉和音频之间对应关系无法直接关联,过去算法往往依赖于手动转换或者人工标注。 现在,研究团队使用聚类的方法,让AI能够轻松识别各种乐器、动物以及日常生活中会出现的声音。 同时,这一方法还

    04

    对话王晶:音频人才亟待培养,高水平研究人员尤其欠缺

    编者按:春节前夕的最后一次采访,LiveVideoStack有幸邀请到了北京理工大学信息与电子学院副教授王晶。王教授目前在北京理工大学信息与电子学院通信技术研究所从事教学科研工作,讲授本科生《数字通信网》和研究生《语音信号数字处理(全英文)》课程。在教学的同时,王教授还承担有国家自然科学基金、国家重大科技专项、国际合作项目及与中国移动、华为等的企事业横向科研项目。她长期参与信息技术领域标准化工作,目前为AVS中国数字音视频编解码标准组织成员,CCF语音对话与听觉专委会委员。在此次与LiveVideoStack的对话中,王教授分享了过去几年音频领域的重要发展和创新、音频编解码器的独特之处、AI与音频编码技术结合的突破以及目前音频领域人才培养和输出所面临的困境等。

    04

    【主编连线】:以歌会友,对话腾讯音乐天琴实验室 X 银河音效

    点击上方“LiveVideoStack”关注我们 ---- 传统的听歌识曲技术是一种严格的基于音频内容的匹配检索技术,它需要检索库中拥有录音相同的歌曲版本,才可以检索成功。但随着短视频、直播等内容的爆发增长,翻唱版本的歌曲层出不穷,对检索库的考验不小。听歌识曲一个看似不起眼的功能,不知道治愈多少音乐爱好者。 此外,还有一项技术应用可以说为喜欢用手机听音乐的朋友们带来更丰富的体验——音效渲染。从模拟时代迈入数字时代,改变音乐重放效果已不再单纯依靠硬件。在今天的数字时代,人们可以通过效果器对音乐做各种各样的后

    03

    【今晚7点】:以歌会友,对话腾讯音乐天琴实验室 X 银河音效

    点击上方“LiveVideoStack”关注我们 ---- 传统的听歌识曲技术是一种严格的基于音频内容的匹配检索技术,它需要检索库中拥有录音相同的歌曲版本,才可以检索成功。但随着短视频、直播等内容的爆发增长,翻唱版本的歌曲层出不穷,对检索库的考验不小。听歌识曲一个看似不起眼的功能,不知道治愈多少音乐爱好者。 此外,还有一项技术应用可以说为喜欢用手机听音乐的朋友们带来更丰富的体验——音效渲染。从模拟时代迈入数字时代,改变音乐重放效果已不再单纯依靠硬件。在今天的数字时代,人们可以通过效果器对音乐做各种各样的后

    02
    领券