我希望在没有- curl或ibm_watson模块的情况下使用IBM语音识别服务。
我的尝试如下:
import speech_recognition as sr
r = sr.Recognizer()
text = r.recognize_ibm(audio,username='',password='')
即使我有IBM云语音文本的“服务凭据”,我也找不到该函数的正确形式。
在recognize_ibm()的文档中,有人说我需要输入才能找到格式的username。
但是link_1坏了。在哪里可以找到username和password?
我还尝试了text
我想知道从哪里可以开始语音识别。不是使用库或任何相当“黑盒”的东西,而是我想知道在哪里可以真正创建一个简单的语音识别脚本。我做了一些搜索,发现并不多,但我看到的是,有‘声音’或音节的字典,可以拼凑成文本。所以基本上我的问题是我可以从哪里开始呢?
此外,由于这有点乐观,我也可以(目前)在我的程序中使用一个库。我看到一些speech to text库和API只输出一个结果。这是可以的,但它将是不现实的。我当前的程序已经检查了输入的任何文本的语法和所有内容,因此,如果我有语音转文本软件的前十个结果,那么它可以检查每个结果,并排除任何没有意义的结果。
我正在使用来使用用户的语音回答我的网页上的问题。在本例中,我正确地创建了所有Node服务器端功能,当我启动API时,服务器会使用webSockets不断地向客户端发送语音文本。我的问题在于React client.js文件。当从服务器接收到语音到客户端的文本时,useEffect不是刷新-- web浏览器的#文本字段(输入标签)。
client.js文件
import io from 'socket.io-client';
import React from 'react';
import ReactDOM from 'react-dom';
i