我正在尝试使用NAudio接收实时语音,并将它们以字节数组的形式发送到bing speech API。
我已经使用事件处理程序接收音频并发送到Bing Speech API。下面是我尝试过的代码。
private void Source_DataAvailable(object sender, WaveInEventArgs e)
{ //convert the sound into a byte array
writer.Write(e.Buffer, 0, e.BytesRecorded);
memoryStream = new MemoryStream(e.Buffer);
CallSpeechAPI(memoryStream);
}
当我尝试执行时,我们得到了下面的响应。
返回: OK {"RecognitionStatus":"InitialSilenceTimeout","Offset":5000000,"Duration":0}结束录制
当我尝试将现有的.wav文件转换为字节数组并将它们发送给API时,它工作得很好。但是对于实时音频,我们面临着这个问题。
有人能帮我解决这个问题吗?如何解决它?
另外,如果有任何选择,以字节数组接收实时音频,请让我知道?
如果有任何示例代码,请与我们分享。
非常感谢你提前
发布于 2018-06-04 04:05:10
我们将很快支持通过字节数组或io.stream的音频流。敬请期待。谢谢你的耐心。
发布于 2018-06-29 21:58:56
现在,new Speech SDK v0.4.0:中提供了对音频输入流的支持。您可以找到samples here。您只需要根据描述的here接口实现您自己的AudioInputStream::Read()和::GetFormat()。
谢谢
https://stackoverflow.com/questions/50522504
复制相似问题