前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >百度语音识别超越Google和苹果,李彦宏做对了什么?

百度语音识别超越Google和苹果,李彦宏做对了什么?

作者头像
罗超频道
发布2018-04-28 13:47:57
1.1K0
发布2018-04-28 13:47:57
举报
文章被收录于专栏:罗超频道罗超频道

《福布斯》给百度带来一份新年礼物,大幅报道了百度在语音识别技术上取得重大突破,发明了一种更精准识别语音的新方法。百度首席科学家吴恩达表示,百度在深度学习领域的发展已经超过了谷歌与苹果,受此利好消息影响,百度股价上涨了3.59%。如果这项技术真具有划时代的革命意义,那百度就此开启并且引领了语音2.0时代,也即是人工智能时代的一个重要分支,改变搜索更改变交互,在IOT(Internet of Things)时代抢占重要位置。

语音识别2.0技术:可适应噪音环境

Siri掀起的语音交互风暴一直还在蔓延。微软Cortana、Google Now、百度语音助手,大量的独立语音助手面世。不少智能设备包括智能手机、智能电视、智能家居、车联网,语音交互也已成为标配。Google、微软、百度等巨头已经将语音识别能力通过API开放出来,大家都在想办法用语音来取代键鼠或者触摸屏这两种最常见的交互方式,尤其是在移动、家居、汽车等特别场景之下。

不过,语音技术包括诸多方面,最核心的几大技术就包括语音识别、语音合成和语义理解。最基础的自然是语音识别,要让机器能“听”之后它才会想、才会说。而语音识别当前存在的几大难题就包括:识别率不高、难以应对噪声环境、无法支持远场识别以及对方言的支持不够强大等等。尤其是抗噪能力更是阻碍了语音交互在车内、移动和商场等典型场景的普及。

百度最新的技术称之为深度语音识别,是深度学习这项通用基础技术在语音上的应用。深度语音识别技术大幅提高了准确率,尤其是抗噪能力,百度通过从9600人那里收集了将近7000小时的语料数据,然后在样本中加入了十五种背景噪音比如,餐厅,汽车和地铁,从而将样本扩张到了10000小时的数据,然后百度团队让系统在噪音中去识别这些语音信息。

与传统语音识别使用统计概率+人工干预不同的是,百度深度语音识别技术采用无监督式机器自动学习,背后则是GPU深度学习基础设施在支撑,不仅更准确,识别所需的运算更加快速和经济。最终在识别范围内允许的单词错误率提高10%,优于Google Speech API,Wit.ai, 微软的Bing Speech和Apple的听写服务。

带来的影响:改变搜索更改变交互

移动搜索的特性之一就是无处不在的多元化的输入方式,图像、位置、语音是典型的新型搜索。百度深度语音识别技术被整合到百度各大产品之中,提高语音识别率之后,可以增强用户使用意愿进而提升用户粘性,并且反过来贡献语料提升语音识别能力,就像输入法、图像识别等采取类似识别技术的应用形成的“正循环”一样。

另一方面,百度可以基于新的语音识别技术开发更多新型应用,尤其是在噪声环境中的语音应用。比如汽车内语音因为有车轮、马达、气流、环境音,一直是一个难点,未来百度CarNet便可采取新的语音技术;再比如百度EYE,试图改变商场导购方式的可穿戴设备,有了新的语音识别技术交互便可以很好地解决;还有大家都在使用的百度地图导航,未来很可能会完全基于语音进行,就像对真人问路一样简单。

除了改变百度本身业务之外,深度语音识别还可以改变当前的语音交互叫好不叫座的现状。一个例子是语音控制智能电视,因为电视本身节目声音这种“噪声”人们试用语音需要先终止正在播放的节目才可。有了抗噪能力之后,就可以直接对正在播放节目的电视喊:换台,给我播放《中国好声音》第二季第一集。总而言之,未来的语音交互有更多的可能性,抗噪能力的解决无异于消灭了困住语音的脚镣。

新年礼物:李彦宏前瞻布局不断获得回报

深度学习是百度2014年开始围绕百度大脑重点投入的人工智能技术,让机器模拟人的大脑皮质神经元思考。百度为了发展深度学习技术,不只是成立了专门的研究机构,还大力招募全球顶尖技术人才。现在深度学习已经被应用到问答、搜索、翻译和图像等诸多应用,现在终于轮到了语音。

与中国其他互联网巨头比如阿里、腾讯们十分注重实际回报不同,李彦宏做了一些看上去充满理想主义情怀和技术主义情结的事情,尤其是重攻人工智能技术。巨量资源的投入看上去回报遥遥无期。而人工智能技术重点是着眼于未来,等到奇点到来之时,李彦宏的技术策略及科技实力才会全面彰显,现在的投入需要极大的耐心和坚持。百度所做的投资最后获益者不只是百度,正如李彦宏在乌镇峰会上的讲话,"一项新技术刚出现时所有人会非常兴奋,期待改变马上发生;但是头几年他们会很失望,它实际的作用好像没那么大。回顾整个人类历史尤其技术史,会发现在长期尺度上,绝大多数人还是低估了技术给人类社会带来的改变。"。看得出来李彦宏还是非常有技术情怀的。

深度语音识别技术这类里程碑事件越来越多,表明了百度的技术投入是非常有价值有效果的,这对百度的业务有巨大的促进作用,同时也让百度在未来的新兴技术竞争中占据一席之地,不改技术驱动型公司的本色。“百度有自己的野心”,李彦宏在前不久百度与Uber战略合作仪式上说过这样一句话,深度语音识别技术超越Google等海外巨头,就是百度的野心。

“罗超”(luochaotmt),就是罗超的微信公众账号。科技改变世界,互联网给了我们自由,这是最好的时代。罗超,是WeMedia联盟成员。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2014-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 罗超频道 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档