首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

百度输入法语音输入为行业首位,离在线语音识别领跑AI应用

2019年上半年结束时,艾媒咨询发布了《2019年上半年中国第三方手机输入法专题研究报告》,以下均称为《报告》,从此报告中可以看出,百度输入法基于百度强大的数据挖掘和中文分词技术,并融合了SMLTA和Attention技术,无论从技术水平上还是用户数量上都领先其他输入法。

百度输入法在技术上取得了很大的突破,其融合了流式截断的多层注意力建模(SMLTA),将在线语音识别精度提升了15%,超越行业最高水平15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。这一技术实现了中文在线语音识别的两大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型、世界上第一次大规模部署在线语音交互注意力模型。首次出现的技术也引来了中国乃至世界的关注。

从这些年语音领域的发展历程来看,Attention模型(注意力模型)早早的被提出,其核心思想是通过机器学习,把整句话中的每个字节或者汉字的音频特征自动的挖掘出来,由于前几年技术发展的局限性,大部分还是采用传统语音识别的状态建模和按语音帧进行解码的技术框架。注意力模型的提出抛弃了旧的框架,给语音领域带来新的活力,直接实现了文本和语音的端到端建模,建模精度得到明显提高。这项技术的四大创新点在于:流式、截断、多级、基于CTC & Attention。

百度输入法近些年来技术进展迅速,语音识别准确率逐步提升,采用的注意力模型为语音识别的端到端建模,这种建模方式使得语音识别系统极度简化,同时,注意力模型也会被认为有较高的识别率。SMLTA中的流式一次,表示可以直接对语音的小片段进行增量解码,而不是整句话进行处理,语音被切割成一个一个小片段,在小片段上展开注意力模型建模和解码,更有助于提高在线语音的识别精度。

SMLTA 也可以看成是百度上一代语音识别模型 Deep Peak 2 的进一步优化。进一步优化的Deep Peak 2系统,充分发挥神经网络模型的参数优势,让离线语音输入相对准确率再次提升,高于行业平均水平35%。这一技术"升级"让用户处于离线状态时也能够自如地借助百度输入法精准地语音输入。且百度输入法的离线语音模型大小仅有谷歌输入法的四分之一,可以为用户带来更加畅快、精准的输入体验。让用户在使用过程中充分体验自由说,无论说什么百度输入法都会展现其高标准的准确率,使得用户对百度输入法的信心增强。

未来,将有越来越多的用户使用手机第三方输入,语音输入的占比也将越来越高,这对百度输入法来说既是机遇也是挑战,百度输入法在全球技术范围内技术的突破有目共睹,未来百度输入法还会持续研究AI技术,持续优化模型和系统,争取带给用户更好的体验,提高语音输入的准确率,做到让客户的语音精确的表达。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190917A09R4T00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券