首页标签语音识别

#语音识别

应用业界最先进的深度学习算法,具备出色的语音转文字、关键词检索、静音检测、语速检测、情绪识别能力

Hey Siri,帮我把这个boss打一下:基于音频的游戏代理探索 | 一周AI最火论文

大数据文摘

该算法还可以在语音识别子词级模型的基础上实现单词错误率的降低。此外,研究人员还证实,我们所学习的词级嵌入包含重要的声学信息,这使得它们更适合用于语音识别。这种新...

9520

碟中谍再现,新研究攻破基于音频的生物识别系统 | 一周AI最火论文

大数据文摘

虽然过去在这一领域中已经提出过几种音视频语音识别模型,并一定程度上提高了在有噪声情况下对纯音频模型的鲁棒性,但很少有针对伦巴第效应(Lombard Effect...

7560

小度助手和它背后的百度AI野望

量子位

自2012年AlexNet问世一举证明机器有深度学习能力以来,计算机视觉、语音识别、自然语言处理、机器人等等应有领域都有了惊人突破,机器已经在图像识别、语音识别...

8430

史上最强最贵Mac Pro诞生,iPadOS和iOS分家!WWDC19全面总结

AI科技大本营

一年一度的WWDC终于来了!43岁的苹果,产品经验位居世界前列。一个迈入中年的公司,该如何持续做出让人惊艳的产品呢?答案就在WWDC 2019!

8260

用于语音识别的数据增强

AI研习社

语音识别的目标是把语音转换成文本,这项技术在我们生活中应用很广泛。比如说谷歌语音助手和亚马逊的 Alexa ,就是把我们的声音作为输入然后转换成文本,来理解我们...

9330

神经网络机器翻译技术及应用(下)

用户1386409

那么挑战在什么地方?我们来看下图中的这个句子,这是一个语音识别的结果,那么要把这样一个语音识别的结果去做同声传译,用机器把它翻译出来,有哪些问题呢?

7510

2019年CCF-腾讯犀牛鸟基金项目课题介绍(三)——自然语言处理及语音识别&大数据&车联网

腾讯高校合作

? CCF-腾讯犀牛鸟基金由腾讯与中国计算机学会联合发起,旨在为全球范围内最具创新力的青年学者搭建产学研合作及学术交流的平台,提供了解产业真实问题,接触业务实...

9040

浙大学霸本科生顶会研究!只需20分钟音频,AI就能逼真模仿你的声音

量子位

这项研究中主要涉及两个任务,文本到语音(TTS,也就是语音合成)和自动语音识别(ASR),缺乏足够多的对齐数据(aligned data)是这两个领域的一大问题...

10720

机器学习工具总览

智能计算时代

当谈到训练计算机在没有明确编程的情况下采取行动时,存在大量来自机器学习领域的工具。学术界和行业专业人士使用这些工具在MRI扫描中构建从语音识别到癌症检测的多种应...

8520

揭秘 TensorFlow:Google 开源到底开的是什么?

GavinZhou

比如Kaldi,它是一个语音识别的工具,实现了语音识别的所有模块,也包括一些语音识别常用的深度神经网络模型,比如DNN和LSTM。

8520

Bidirectional RNN (BRNN)

Steve Wang

Synopsys · IT Intern (已认证)

双向循环网络的缺点是在任意位置输出预测之前,你需要完整的数据序列(比如一个完整句子)。在一个语音识别的应用场景下,BRNN需要整个语音即说话人全部说完才能进行处...

6220

端到端的深度学习

Steve Wang

Synopsys · IT Intern (已认证)

如上图,传统的语音识别大致包括四个步骤,而端到端的深度学习直接接收声音输入,然后完成听译过程。

6520

DeepSpeech源码编译及语音识别效果复现

sparkexpert

DeepSpeech是国内百度推出的语音识别框架,目前已经出来第三版了。不过目前网上公开的代码都还是属于第二版的。

8120

CTC模型、安装及其pytorch绑定安装

sparkexpert

CTC模型是语音识别模型中常见的模块之一,现有主流的语音识别系统经常采用该模型来实现端到端的语音识别。而CTC出现之前,语音识别模型的端到端识别效果还是相对较弱...

8330

科大讯飞连发五款TO C产品,还给录音笔装了一块屏

镁客网

21日,在科大讯飞2019年新品发布会上,该公司董事长刘庆峰认为A.I.技术价值的兑现有3个标准:

8720

微软提出极低资源下语音合成与识别新方法,小语种不怕没数据!| ICML 2019

AI科技大本营

编者按:目前,人类使用的语言种类有近7000种,然而由于缺乏足够的语音-文本监督数据,绝大多数语言并没有对应的语音合成与识别功能。为此,微软亚洲研究院机器学习组...

8830

搜狗发布新研究:语音+唇语让语音识别更准确

量子位

通常当语音环境比较安静时,语音识别的准确率会比较高,但当语音环境较为嘈杂时,语音识别的准确率会明显下降。

11020

动态 | 序列转换模型三合一!谷歌提出首个端到端的直接语音翻译模型

AI科技评论

AI 科技评论按:不同语言之间的语音到语音转换早已不是什么新鲜事了,任务拆分简单直接,只需要把「源语言的语音识别模型(语音转文本)」、「文本到文本翻译模型」、「...

10520

ZLG深度解析——语音识别技术

刘盼

语言作为人类的一种基本交流方式,在数千年历史中得到持续传承。近年来,语音识别技术的不断成熟,已广泛应用于我们的生活当中。语音识别技术是如何让机器“听懂”人类语言...

11320

重建「巴别塔」:谷歌推出全新端到端语音翻译系统

机器之心

可能是职业习惯,《流浪地球》中有一幕让小编印象非常深刻:刘培强戴着耳机和俄罗斯宇航员交流,两人各自说着母语,然后被实时同步翻译,毫无障碍不说,甚至拉家常开玩笑都...

10140

相关产品

  • 语音识别 ASR

    应用业界最先进的深度学习算法,具备出色的语音转文字、关键词检索、静音检测、语速检测、情绪识别能力

活跃用户

  • 臧瑟

    不务正业的程序猿。
    0 文章1 回答0 关注
  • 罗罗可爱多

    腾讯 · 高级研究员 (已认证)

    腾讯云大数据AI产品中心高级研究员。
    0 文章1 回答8 关注

扫码关注云+社区

领取腾讯云代金券