我正在构建一个Win环球应用程序,它具有观看学生目前正在观看或亲自参加的讲座的现场字幕的功能。我正在寻找一个内置的免费解决方案来做音频到文本操作。
macOS有我们将要使用的语音库https://developer.apple.com/documentation/speech,但是在Windows上找不到类似的。在Windows.Media包上找到了文档,但无法确定它是否实际具有audio2text api或仅仅是命令识别https://learn.microsoft.com/en-us/uwp/api/windows.media.speechrecognition?view=winrt-22621。
也许有人有在Windows上建立这样的功能的经验?
发布于 2022-09-01 07:23:07
是的,您可以使用Windows.Media.SpeechRecognition API进行语音识别,而不仅仅是在命令识别方面。
您可以使用这里的官方语音识别示例SpeechRecognitionAndSynthesis做一个简单的测试。只需记住启用在线语音识别(设置->隐私->语音)。
https://stackoverflow.com/questions/73562612
复制相似问题