我正在用Google cloud vision测试OCR,我发现结果特别糟糕。我的文档是法语的,但它遗漏了许多撇号和逗号。例如作为输入
使用代码
Request
.post(`https://vision.googleapis.com/v1/images:annotate?key=AIzaSyAtArxxxxxxxxxxxxxxxxxpGrKrydU4`)
.send({
requests: [{
image: { content: base64.replace('data:image/jpeg;base64,', '') },
features: [{ type: 'DOCUMENT_TEXT_DETECTION' }],
"imageContext": { "languageHints": [ "fr" ] }
}]
})
我得到了结果(错误以黄色突出显示)
当我用Microsoft Azure OCR测试相同的图像时,结果是绝对完美的,而不需要指明语言。
有没有人在Google Cloud Vision中遇到过类似级别的不准确?
发布于 2018-09-04 16:43:21
您可以使用"languageHints": ["fr"]
指定它
{
"requests": [
{
"imageContext": {
"languageHints": ["fr"]
}
}
]
}
https://stackoverflow.com/questions/46516766
复制相似问题