我能够使用SynapseML的转换器SynapseML将wav文件转换为Databricks中的文本。但是,对于mp3,我有一个错误:0x27 (SPXERR_GSTREAMER_INTERNAL_ERROR)。
在他们的文档(https://mmlspark.blob.core.windows.net/docs/0.10.0/pyspark/synapse.ml.cognitive.html#module-synapse.ml.cognitive.SpeechToTextSDK)中,明确指出支持mp3的还有:

我有一个不同格式的音频文件列表:
wasbs://test@blobstorage.blob.core.windows.net/file1.mp3 wasbs://test@blobstorage.blob.core.windows.net/file2.wav
我在SpeechToTextSDK中使用了以下转换器,代码如下:
import synapse.ml
from synapse.ml.cognitive import *
stt = (SpeechToTextSDK()
       .setSubscriptionKey(YOUR_API_KEY)
       .setLocation(REGION)
       .setOutputCol("text")
       .setAudioDataCol("wavbytes")     
       .setFormatCol("format")
       .setLanguageCol("lang")
       .setStreamIntermediateResults(False)
      )
results = stt.transform(wav_audio_list)有人有主意吗?
事先非常感谢,
发布于 2022-07-27 06:52:03
与您分享我的解决方案:我通过init脚本安装了Gstreamer。这里描述了Gstreamer ()和ini脚本配置(https://docs.databricks.com/clusters/init-scripts.html)的过程。
一旦安装了Gstreamer并配置了ini脚本,转换器就可以以多种语言和多种格式顺利运行。
https://stackoverflow.com/questions/73060973
复制相似问题