语音的交互是一个认知与辨识的过程,所以绝对不能与语法、语义和用语规范等方面分裂开来。系统会先对原始语音信号进行处理,再进行特征提取,消除噪声和不同说话人的发音差异带来的影响,使处理后的信号能够更完整地反映语音的本质特征提取。算法会消除噪声和不同说话人的发音差异带来的影响,使处理后的信号能够更完整地反映语音的本质特征。
实现人机间自由的语音交互成为未来AI的发展趋势。一项新技术投入市场伴随着一些兴奋点,但也会存在一定的改善空间。
首先,智能语音市场需要针对特定的人群,特定的场景做适当的改变。目前来看人机交互在实时性、准确性等方面还需提高。
其次,语音输入的内容会涉及各种各样专业的知识,智能语音系统在了解人类语言表面意思的基础上,更进一步识别其深层含义,所以智能语音系统的知识图谱也是很大的挑战,对输入输出、编码译码都要做很高的要求,才能让人机交互达到一个爆发点。
语音识别技术借助飞速发展的高速信息网,可实现计算机的全球联网和信息资源共享,因此被广泛应用的系统有:语音输入和控制系统、电销机器人、智能电话查询系统、智能家电及玩具等方面。
语音识别功能是一项非常有发展潜力的技术。可以设想,我们平时生活中很多地方都可以用到它,它可以大大便利我们的生活和工作,比如智能手机,智能空调及冰箱,电动门,汽车导航,机器人控制,医疗设施等等。
可以毫不夸张的说,21世纪将会是语音识别广泛流行和普及的时代。
领取专属 10元无门槛券
私享最新 技术干货