我正在尝试构建一些需要医生或医学抄写员来口述发现的东西。使用GCP python sdk中的Google SpeechClient识别音频并转换为文本。但它的误差率约为15%~20%。
例如:“伯德呼吸器”被认为是“鸟的呼吸器”。“Cheyne- Stokes呼吸”被认为是"Shane Stokes呼吸“。
我尝试过很多可能的表达方式。是否有任何其他规定或其他库附加组件来提高其准确性?
发布于 2019-09-12 09:16:22
“伯德呼吸器”和“鸟呼吸器”听起来是一样的。对于这种情况,我建议在代码中进行替换。
对于晦涩的单词/短语,您可以添加短语作为提示:https://cloud.google.com/speech-to-text/docs/context-strength
https://stackoverflow.com/questions/57887536
复制相似问题