语智科技FFASR远场语音识别开发者平台即日上线
什么是FFASR?
语智科技FFASR(Far-Field Automatic Speech Recognition) 是专门针对于远场语音交互开发的识别引擎,使远场交互不再局限于麦克风阵列,使任意麦克风采集的音频亦可接入云端识别引擎,获得语音识别结果。
FFASR与传统ASR有什么区别?
FFASR有哪些特点?
为什么FFASR拥有领先15%的卓越性能?
在FFASR远场语音识别引擎上实现这一优异的性能表现,是基于语智科技对远场语音识别的技术链条上每个环节有着学术积累和深刻理解,以及在远场降噪、Deep Learning、声学模型、语言模型等多个领域拥有的技术积累和整合能力。
具体来说,由于FFASR远场识别引擎是通过算法进行声学降噪处理,因此对声学降噪需要解决的三个干扰问题——噪声、混响、干涉进行了精确的数学建模,这同时对处理声学降噪的神经网络提出了更高的设计要求。为了能够同时处理前端声学降噪和语音识别,语智科技FFASR算法将CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)进行了深度整合,搭建了更复杂的深度学习网络,并将网络分成很多部分,用以处理不同的任务。而这样的神经网络还需要更适配和先进的训练平台,语智科技独立设计了的训练平台,替代通常使用的Kaldi ASR进行网络结构训练。
哪些人群适合使用FFASR?
1.手机厂商
2.IoT设备厂商
3.想拥有远场语音交互能力又不想/能使用麦克风阵列的人
4.Geeks
即刻接入FFASR远场语音开发者平台,是时候,让远场语音交互真正来临
领取专属 10元无门槛券
私享最新 技术干货