我正在使用Kinect + Microsoft.Speech进行语音识别。
要获得输入音频流,必须执行以下操作
Stream kinectAudioStream = myKinect.AudioSource.Start();
并开始语音识别
speechRecognitionEngine.SetInputToAudioStream(kinectAudioStream, new SpeechAudioFormatInfo(...));
speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);
我的目标是实时可视化输入信号(就像示波器一样),同时进行语音识别。
我尝试了一些事情,比如在微软的"AudioBasics-WPF C# Sample“中多线程添加语音识别。它可以工作,但延迟非常糟糕。语音识别和可视化中的许多中断。
有什么方法可以提高性能吗?有谁有主意吗?
发布于 2013-07-20 04:51:15
嗯,你最好的选择是下拉到Kinect DMO并连接一个SmartTee过滤器,但这需要你用C++编写,因为KinectAudioSource不会暴露过滤器本身。
https://stackoverflow.com/questions/17693959
复制相似问题