首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

百度大脑发布语音交互的新技术

PingWest品玩11月28日讯,百度大脑今天发布了基于复数CNN的语音增强和声学建模一体化的端到端识别技术。这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。

百度语音首席架构师贾磊告诉PingWest品玩,“这项技术完成了数字信号处理和语音识别这两个领域的技术革命,用端到端一个声学模型,不需要任何领域行业的支持,解决两个跨领域的语音识别问题。”

“我们获得了比目前百度音箱现有产品,超过30%以上错误率的下降,即语音识别性能提升30%,这也是目前我们在国际业内同行看到的提升最大的,利用深度学习来完成语音交互的系统。”

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191128A0EDXC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券