让机器更懂“你”，语音交互让人机共生前景明朗

文章来源：企鹅号 - 工控中国

人机交互的目的是为了让机器更懂“你”，让用户更加自如。人机之间的自然交互一直是人工智能领域的一个美好愿景，而语音是人机交互中最重要的手段之一。

今天我们说的语音识别、人脸识别还有一些生物识别比如指纹、虹膜等等，这些东西其实都属于人机交互的技术。当然它后面可能还有人工智能的支撑，可是不会所有的东西都只通过语音，或者是人脸识别，它可能是人机交互的一部分入口，但是它绝对不是全部的入口。

自然交互中，我们还很期待一些很科幻的场景，比如我们在很多科幻片中会有这样的，像手势、姿态的交互和识别。实际上手势识别或者姿态的识别，在人机交互是一个很难的命题，像一些具体的任务上，比如空中打字，也就是我抬手，现在很多人有盲打的能力，实际上你一抬手就在敲你想打的字，你已经有了这个习惯。

目前，中国正在向“2030年成为世界领先的人工智能创新中心”这个目标大步迈进，四个新成立的国家人工智能开放创新平台更是相当引人注目，Al将在今后以人类辅助性伙伴的形式参与到人类各项实际应用之中。

随着接口技术的变化，交互模式也发生了变化，计算机从实验室、机房已经走到了我们的办公室、家庭，甚至今天已经都走到了我们的手上，计算机的台数也发生了极大的数量级变化。

目前，在一些特定的情境里，语音交互已经成为主要的方式了。语音时代的最大意义在于，真正做到了解放双手。尤其在汽车里、家里这样的场景，意义非凡。解放了双手之后，人类与世界的交互，才第一次实现了随时随地，随心所欲。

简单地说，世界是由懒人创造的，人机交互的演进也可以认为是人们越来越懒的演进过程。俗话说得好，“能动口的绝不动手”，就是这个道理。语音最大的优势是，它是人类最自然的交互方式。

国家政策层面，也在大力推动智能语音的发展。去年12月14日，科技部印发《促进新一代人工智能产业发展三年行动计划(2018—2020年)》，明确对智能语音的发展做出展望，“到2020年，实现多场景下中文语音识别平均准确率达到96%，5米远场识别率超过92%，用户对话意图识别准确率超过90%。”

当然，语音交互目前还存在很多问题。比如由于空间距离、背景噪音、其他人声干扰、回声、混响等多重复杂因素，进而导致的识别距离近、识别率低等明显痛点。再比如单是中国语系、方言和口音就相当多，加上中文的多语义性，所以不同地区的人使用语音控制识别率差异较大。同时，在语义识别上，也存在上下文的关联带来识别的学习难、定位难和建立模型难等问题。

未来，随着计算超速手机渗入到我们生活更多方面，智能技术的进步，也将为人机共生的美好前景提供支撑的技术。

发表于: 2018-01-152018-01-15 18:20:37
原文链接：http://kuaibao.qq.com/s/20180115A0OS1H00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

让机器更懂“你”，语音交互让人机共生前景明朗

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐