问用于医学术语的谷歌SpeechClient效率
EN

Stack Overflow用户

提问于 2019-09-11 18:53:07

回答 1查看 52关注 0票数 0

我正在尝试构建一些需要医生或医学抄写员来口述发现的东西。使用GCP python sdk中的Google SpeechClient识别音频并转换为文本。但它的误差率约为15%~20%。

例如：“伯德呼吸器”被认为是“鸟的呼吸器”。“Cheyne- Stokes呼吸”被认为是"Shane Stokes呼吸“。

我尝试过很多可能的表达方式。是否有任何其他规定或其他库附加组件来提高其准确性？

发布于 2019-09-12 09:16:22

“伯德呼吸器”和“鸟呼吸器”听起来是一样的。对于这种情况，我建议在代码中进行替换。

对于晦涩的单词/短语，您可以添加短语作为提示：https://cloud.google.com/speech-to-text/docs/context-strength

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57887536

复制

相似问题

问用于医学术语的谷歌SpeechClient效率EN