未来架构师(7)

未来我们有多懒

大家是不是希望在生活中有一个万能助理,比如,下班回到家,只要说一声“把灯打开”,灯就自动亮了;说一声“烧壶水”,电热水壶就自动开始烧水;说一声“播放汪峰的《春天里》”,音响就自动播放这首歌……

未来,有了智能的虚拟个人助理,在任何场景中,我们都可以用语音交互来让它提供服务。更为重要的是,它可以把我们所有的生活场景都串联起来,成为无处不在的贴身助理,随时随地为我们提供应声而至的服务。

那么,机器到底是怎么理解人类的语音,并进行自然交互的呢?举一个简单的例子。比如,想让机器告诉你,北京后天的温度有多高。机器为了进行这个对话,它需要进行以下的操作。首先,它要进行语音识别,然后理解这些语音、搜索数据,最后把答案播放出来。这个过程听起来比较简单。事实上,人类为了达到这么一个简单的语音交互,全世界成千上万的科学家、工程师,奋斗了几十年。

我做了相关搜索,惊奇地发现,原来全世界有20%的人在说中文,中文是全世界使用人口最多的语言;但是,当时世界上对中文的研究以及产品的应用是非常少的,绝大部分的研究都是围绕英文而做的。就是这个小发现,使我产生了一种使命感,我想回到中国,为十几亿人打造一个好的中文语音交互。

早期的创业非常艰辛,训练一个语音识别系统,需要成千上万个小时的语音样本数据。我以前所在的公司每年可能会花费几千万甚至上亿元人民币去购买这样的数据。但这对一个创业公司是非常奢侈的,所以,当时我们的很多员工一有空就会帮着录制语音数据,有一位烧饭的吕阿姨,她每天中午做完饭以后的主要任务,就是帮我们录几个小时的语音数据,由于对菜谱特别了解,她每天录的数据大多是宫保鸡丁、麻辣豆腐之类的菜名。因此,我们第一个上线的语音识别系统,在识别这些菜名时特别精准。

现在,我们开发了很多拥有自主核心技术的语音交互产品,也打造出了一个懂你、懂中文的虚拟个人助理,而且,它可以跨越不同的场景,比如汽车里、居家时、户外运动中……它应该是全世界第一个可以跨场景联动的虚拟助理。我们创造了一条非常独特的人工智能落地消费产品的探索之路。

未来随着自动化、万物互联、人工智能等技术的发展,人们在肢体上一定会变得越来越懒,这是不可阻挡的趋势。人们就是应该利用计算机、自动化的技术来开发很多工具,去取代那些重复的、不需要创意的简单劳动,让自己有更多的时间去思考、去创新、去创造。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180722A0R3KS00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券