首页
学习
活动
专区
工具
TVP
发布

AI科技评论

专栏作者
4092
文章
3384764
阅读量
184
订阅数
语音 AI 之路:约翰霍普金斯大学 CLSP 群英谱
“吴军、徐鹏、李志飞、陈果果、姚旭晨……这是一个有志青年从约翰霍普金斯大学离开之后,用 AI 改变世界的故事。”
AI科技评论
2023-10-24
2100
OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平
作者 | 黄楠 编辑 | 陈彩娴 9月21日,OpenAI 发布了一个名为「Whisper 」的神经网络,声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。 「Whisper 」式一个自动语音识别(ASR)系统,研究团队通过使用从网络上收集的68万个小时多语音和多任务监督数据,来对其进行训练。 训练过程中研究团队发现,使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。 此前有不同研究表明,虽然无监督预训练可以显著提高音频编码器的质量,但由于缺乏同等高质量的预训练解码器,以及特定于
AI科技评论
2022-09-22
1.9K0
ICASSP 2022丨字节跳动最新音乐检索系统ByteCover2,检索速度提高八倍
翻唱识别(CSI)是音乐信息检索(MIR)领域的一项重要任务,在歌曲搜索,音乐分发,曲库整理,智能推荐等场景下有着重要作用,被誉为下一代音乐识别技术。 近期,字节跳动火山语音团队的最新音乐检索系统ByteCover2入选了ICASSP 2022。这一系统主要面向翻唱识别(CSI)这一音乐信息检索(MIR)领域的一项重要任务,通过表征学习方法让其具备提取音乐核心特征的能力,并且该特征能够对种类繁多的音乐重演绎具有良好的鲁棒性,检索速度提高8倍。经Da-Tacos数据集上的评估,准确率远超其他方案的SoTA性能
AI科技评论
2022-05-27
8150
前微软首席 AI 科学家邓力再易东家,加入梵蒂冈投资
作者 | 王玥 编辑 | 陈彩娴 量化投资管理公司 Vatic Investments(梵蒂冈投资)近日宣布任命邓力博士为首席人工智能官兼机器学习全球负责人,该决定自 2022 年 5 月 9 日起生效。 图注:邓力博士 集加拿大工程院院士、IEEE Fellow、ASA(美国声学学会)Fellow以及ISCA Fellow等多种荣誉于一身,邓力博士一直被公认为是人工智能和机器学习领域世界领先的专家。邓力博士的研究方向主要为应用于大数据、语音、文本、图像和多模态处理的深度学习和机器智能方法,以及人工智能和
AI科技评论
2022-05-16
7010
清华大学孙茂松:自然语言处理一瞥,知往鉴今瞻未来
近日,清华大学人工智能研究院常务副院长孙茂松教授亲手执笔,对自然语言处理的贡献、当前境界与未来挑战进行了深入的探讨。AI科技评论编辑组深有同感,认为此文十分值得一读,故分享之。 作者 | 孙茂松 来源 | 中国人工智能学会 人类语言(即自然语言)的重要性无论怎么讲都不为过。社会生物学之父爱德华·威尔逊曾说过:“语言是继真核细胞之后最伟大的进化成就。”科普畅销书《信息简史》的作者詹姆斯·格雷克也深刻地指出:“语言本身就是人类有史以来最大的技术发明。”这些断言带有科学哲学的意味,反映了现代人类对语言本质理解的不
AI科技评论
2022-03-14
3020
160 亿美元!微软拟收购语音巨头 Nuance,史上第二大收购
早在 2014 年,苹果语音助手 Siri 技术提供商、全球最大语音识别公司 Nuance Communications 和数家潜在巨头买家洽谈收购事宜的消息就频频见诸报端。
AI科技评论
2021-04-16
3000
一颗芯片解决所有语音交互,百度做了一项改变行业的技术革新
4月20日,百度旗下人工智能品牌小度发布了新款无屏智能音箱——小度智能音箱 2 红外版。据百度官方介绍,该音箱搭载了百度首款针对远场语音交互研发的鸿鹄芯片,性能上有三大提升:1)在语音识别上错误率平均降低30%;2)高噪声下首次唤醒率提升10%以上,且达到家居场合使用的超低误报要求;3)平均工作功耗仅100mw左右,待机功耗下降90%。
AI科技评论
2020-04-23
7680
今日 Paper | 联合抽取;流式语音识别;差异学习;Skip-Thought向量等
将混合CTC/Attention方法嵌入到Transformer结构中实现在线端到端的流式语音识别架构
AI科技评论
2020-04-20
3330
数据之战:NLP迈向实用阶段的核心所在
随着人工智能技术越来越多的应用到我们的工作和日常生活中,人们对与计算机交互提出了更高的要求。人们显然已不满足于只是简单的人机对话,而是畅想可以达到人与人交流那样的酣畅淋漓,就像科幻片像人们所展现的那样。
AI科技评论
2020-03-12
5440
CIF:基于神经元整合发放的语音识别新机制
论文题目:CIF: Continuous Integrate-and-Fire for End-to-End Speech Recognition
AI科技评论
2020-03-05
1.6K0
今日 Paper | 蚊子叫声数据集;提高语音识别准确率;对偶注意力推荐系统等
论文名称:Improved Robust ASR for Social Robots in Public Spaces
AI科技评论
2020-02-13
8280
Interspeech 2019 | 基于多模态对齐的语音情感识别
语音领域顶级学术会议 Interspeech于2019年9月15-19日在奥地利格拉茨举行。
AI科技评论
2019-09-25
3K0
依图科技声纹识别权威竞赛夺冠,智能语音再下一城
在奥地利召开的机器语音国际顶会 InterSpeech 2019 上,国际声纹识别权威竞赛 VoxCeleb Speaker Recognition Challenge(VoxSRC)公布最新结果,依图科技大幅领先海内外多支强队获得冠军,再次展示了世界级人工智能算法实力。
AI科技评论
2019-09-12
1.1K0
专访俞栋:多模态是迈向通用人工智能的重要方向
随着语音识别、自然语言处理、计算机视觉等人工智能技术日益成熟,并逐渐落地到实际场景中,如何实现大规模应用落地或者说如何通往通用人工智能,越来越成为这些领域的研究者探索和思考的命题。
AI科技评论
2019-09-12
1.6K0
「LSTM之父」 Jürgen Schmidhuber访谈:畅想人类和 AI 共处的世界 | WAIC 2019
2019 年 8 月 29 日,世界人工智能大会 WAIC 2019 在上海世博中心举行。瑞士 USI 和 SUPSI 教授,NNAISENSE 联合创始人兼首席科学家,「LSTM 网络之父」 Jürgen Schmidhuber 也受邀出席大会。
AI科技评论
2019-09-10
7310
动态 | 序列转换模型三合一!谷歌提出首个端到端的直接语音翻译模型
AI 科技评论按:不同语言之间的语音到语音转换早已不是什么新鲜事了,任务拆分简单直接,只需要把「源语言的语音识别模型(语音转文本)」、「文本到文本翻译模型」、「目标语言的语音生成模型(文本转语音)」这三个模型串联使用就可以。由于这三类模型的发展都各自比较成熟,现在市面上如谷歌翻译这样的软件产品、如科大讯飞翻译机这样的专用硬件设备都能达到很好的多语互译效果,准确率和延时都让人比较满意。
AI科技评论
2019-05-20
6290
对话微软黄学东:语音语言技术是镶在 AI 皇冠上的明珠
AI 科技评论按:上一次你和你的电脑进行有意义的对话,并感受到它能真正地理解你,是什么时候?如果微软技术研究员、微软的语言语音小组组长黄学东博士做到了的话,那么你也将可以做到。并且,如果他以往的研究真的达到了他所说的水平的话,这一天的到来可能要比你想的还要快。
AI科技评论
2019-05-20
5280
业界 | 谷歌用新的语音数据扩增技术大幅提升语音识别准确率
AI 科技评论按:把一段输入音频转换为一段文本的任务「自动语音识别(ASR)」,是深度神经网络的流行带来了极大变革的人工智能任务之一。如今常用的手机语音输入、YouTube 自动字幕生成、智能家电的语音控制都受益于自动语音识别技术的发展。不过,开发基于深度学习的语音识别系统还不是一个已经完善解决的问题,其中一方面的难点在于,含有大量参数的语音识别系统很容易过拟合到训练数据上,当训练不够充分时就无法很好地泛化到从未见过的数据。
AI科技评论
2019-05-08
1.1K0
观点 | 关于 AI 的应用与实践,腾讯 AI 研究员做了以下思考
AI 科技评论按:由腾讯优图主办,腾讯云、腾讯 Ai Lab 和极客邦协办,主题为「智变未来-浅谈人工智能技术应用与实践」的技术沙龙活动 3 月 23 日在北京举办,沙龙上来自腾讯、intel 的五位嘉宾就技术、产品、实践和应用等 Ai 话题展开分享。
AI科技评论
2019-05-08
7560
动态 | Facebook 开源首个全卷积语音识别工具包 wav2letter++
AI 科技评论按:近日,Facebook 人工智能研究院 ( FAIR ) 宣布开源首个全卷积语音识别工具包 wav2letter++。系统基于全卷积方法进行语音识别,训练语音识别端到端神经网络的速度是其他框架的 2 倍多。他们在博客中对此次开源进行了详细介绍。
AI科技评论
2018-12-29
8010
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档