2018年语音智能设备普及家庭将达1亿未来十年技术支撑又是什么？

文章来源：企鹅号 - 声学在线

据外媒Engadget报道称，谷歌在发布的新款手机Pixel的同时，还会借机推出一款特殊的无线充电器。该充电器同时具备语音助手的功能，如果用户允许手机将Pixel Stand识别为可信任的底座，即使手机已锁定，也可以召唤助手。

根据信息显示，看起来 Google 智能助理将与 Pixel Stand 集成。而像Pixel Stand、Amazon Echo这样加载了语音助手的智能设备，相关数据显示，预计2018年将会有一个亿的家庭拥有这类设备。

那么专注于语音交互的语音助手在未来又会有怎样的发展呢

现在，我们将人机对话视为由两部分组成：

·自然语言理解（NLU） - 理解用户所说的内容

·自然语言生成（NLG） - 为用户制定合理的主题响应

最近的研究注意力主要集中在第一部分，但是仍然存在许多挑战，目前AI领域中只有机器学习发展的较为完善，但是机器学习并不适合自然语言理解和自然语言生成，这就需要我们去开发新的工具。

如果要解决自然语言生成问题就必须要允许人类进行创造性输入，能够控制合成角色的语气，风格和个性。

同时，就会话体验来看，也非常简单且受限，为了超越这些限制，我们需要支持更高真实度的对话。实现这一目标有以下几个部分：

1.广泛而深入的对话。现在的大多数会话体验基本只停留在表面或者在一个很窄的领域进行深入探讨。为了超越这些有限的经验，我们需要进入一个广泛而深入的对话世界。这需要语音助手更好地理解用户输入的上下文，以便能够作出适当反应，对谈话的状态(内存)进行有力的跟踪。

2.个性化。在两个人之间每个人通常会根据于另一个人之前的相处经验与对方自然地对话。但是计算机现在无法做到这一点，而解决这个问题的必须要解决个人识别这方面的挑战，首先要让计算机知道你是谁，才可以对你和其他人做出不同的反应。

3. 多模式输入和输出。无论是用户输入还是对话AI输出都可以有多种方式。例如，除了提供口头输入之外，用户还可以按下屏幕上的按钮选择AI提供的“是”或者“不是”。再比如情绪分析可用于提供给计算机使之做出相应反应。

当然，我们距离科幻小说中所描述的流畅的人机对话还有很长的路要走。希望本文中提及的关键进展可以使得我们更加接近这一长期愿景。

-End-

编辑：C&C

本文章图片来源于网络，侵权必删

想要了解更多人工智能领域的行业动态，欢迎关注声学在线公众号！

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货