我尝试使用Watson Speech to Text服务实现语音识别。我用"MediaStreamRecorder“库用javascript写了一些代码。我通过Websocket发送数据,得到这个问题:如果我使用"content-type":“音频/wav”,Watson只识别第一个blob,并将inactivity_timeout设置为默认值,而我将其设置为2秒。
我使用以下代码打开websocket:
initWebSocket(startRecordingCallback) {
var that = this;
that.websocket = n
我正在尝试使用pythonspeech_recognition从系统音频获取一个输入,然后将其打印为输出。不幸的是,我在设备列表上遇到了一些问题。事实上,speech_recognition似乎只识别麦克风作为输入设备。
我的想法如下:我非常缓慢地记录重要视频中心的笔记,所以我希望让Python为我写下它们,这样我就可以赶上丢失的片段了。你觉得有可能吗?多么?
到目前为止,这是我的代码:
import pyaudio
import speech_recognition as sr
r=sr.Recognizer()
r.energy_threshold=4000
for index, na