如何打造能听会说的语音小助手？

文章来源：企鹅号 - KnowingAI知智

与设计 Chatbot 相比，语音助手的设计有哪些注意事项？

语音输入又有哪些优点和缺点？

点击下方视频，你对人工智能的了解就能轻松超过全世界 99% 的人类！

图文版本送给不方便打开的朋友 (°u°)」

上一季中，我们介绍了设计开发 chatbot 的方法。

为chatbot加上语音识别、语音合成等模块，基本就是一个能听会说的语音小助手。

不过语音助手的设计上还是有不少独特的注意事项，比如形象设计。

听觉形象可以借由音色、节奏、音调、响度做出设计。沉稳缓慢的语调能表达出服务与尊敬，戏谑与快节奏适合聊八卦，软萌萌的声音适合和小朋友聊天。

比如唤醒。

实体按键可以唤醒，虚拟按键也可以唤醒，用得最多的还是通过「唤醒词」进行语音唤醒。唤醒词不能太常见，最好在 3-4 个字节左右，不然很容易「误触」。

再比如，区分用户。

如果是在多人家庭中存在的语音交互设备，最好能利用声纹识别认出不同的用户，并根据日常的聊天内容为他们设置标签。这样即使他们说出同一句话，也能了解语言背后的真实意图。

设计能听会说的小助手的过程，就是「语音交互设计」。

与文字输入相比，语音交互输入信息的优点在于速度快、能解放双手、没有学习成本。

但不免也有缺点。比如接受信息速率较低、无法保护隐私、也无法适应复杂的任务。

在各个API 开放平台，都有语音识别、语音唤醒、语音合成的接口可供调用。

感兴趣的话，不妨自己试试看吧！

「知智一分钟」是由「KnowingAI知智」推出的，以人工智能基础知识为主的短视频栏目。

每次一分钟，轻松了解 AI 领域基础概念！

「知智一分钟」现已入驻 B 站，

欢迎投硬币投香蕉发弹幕吐槽我们！

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货