我担心有什么办法可以为说话人的声音做文字翻译。
场景:
通过Team或Skype对通话双方进行语音(语音)到文本的运行时翻译。
我试过Google Api和Microsoft Api,但在这两种情况下,它只为一方语音进行翻译,而不是为呼叫中的另一方语音进行翻译。我尝试使用来自Microphone() python包的speech_recognition函数,但没有成功。
我在互联网上到处搜索,但都给出了通过麦克风和录音文件(.wav)进行语音识别(语音到文本翻译)的例子。通过录音文件,我能够做到这一点,但是,我想做的实时翻译时,我在电话通过Team或Skype。
如果任何人在这方面有任何知识,请分享。提前谢谢。
注:,如果你愿意的话,我可以重新解释一下。
发布于 2021-07-27 08:59:36
import speech_recognition as sr
for index, name in enumerate(sr.Microphone.list_microphone_names()):
print("Microphone with name \"{1}\" found for `Microphone(device_index {0})`".format(index, name))https://stackoverflow.com/questions/66133480
复制相似问题