首页
学习
活动
专区
工具
TVP
发布

如何打造能听会说的语音小助手?

与设计 Chatbot 相比,语音助手的设计有哪些注意事项?

语音输入又有哪些优点和缺点?

点击下方视频,你对人工智能的了解就能轻松超过全世界 99% 的人类!

图文版本送给不方便打开的朋友 (°u°)」

上一季中,我们介绍了设计开发 chatbot 的方法。

为chatbot加上语音识别、语音合成等模块,基本就是一个能听会说的语音小助手

不过语音助手的设计上还是有不少独特的注意事项比如形象设计

听觉形象可以借由音色、节奏、音调、响度做出设计。沉稳缓慢的语调能表达出服务与尊敬,戏谑与快节奏适合聊八卦,软萌萌的声音适合和小朋友聊天。

比如唤醒

实体按键可以唤醒,虚拟按键也可以唤醒,用得最多的还是通过「唤醒词」进行语音唤醒。唤醒词不能太常见,最好在 3-4 个字节左右,不然很容易「误触」。

再比如,区分用户

如果是在多人家庭中存在的语音交互设备,最好能利用声纹识别认出不同的用户,并根据日常的聊天内容为他们设置标签。这样即使他们说出同一句话,也能了解语言背后的真实意图。

设计能听会说的小助手的过程,就是「语音交互设计」。

与文字输入相比,语音交互输入信息的优点在于速度快、能解放双手、没有学习成本

但不免也有缺点。比如接受信息速率较低、无法保护隐私、也无法适应复杂的任务

在各个API 开放平台,都有语音识别、语音唤醒、语音合成的接口可供调用。

感兴趣的话,不妨自己试试看吧!

「知智一分钟」是由「KnowingAI知智」推出的,以人工智能基础知识为主的短视频栏目。

每次一分钟,轻松了解 AI 领域基础概念!

「知智一分钟」现已入驻 B 站,

欢迎投硬币投香蕉发弹幕吐槽我们!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190123A1A3FW00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券