我有一个关于Azure Form Recognizer的手写文本OCR的问题。
在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。
有没有一种方法可以自己输入OCR检测不到或检测不正确的文本?
例如,下面的图片是Azure的示例标签工具中的OCR拾取的:OCR detection sample image。
有没有办法纠正这个结果,并告诉Form Recognizer文本应该是:"Bridget Sims,MD"?
发布于 2020-07-21 07:17:31
目前还没有办法立即校正OCR结果并提高其准确性。典型的场景是从一小组训练文件训练一个表单识别器模型,并使用它来处理更多的文档。在训练过程中,少量的OCR错误对模型质量并不重要,您可以忽略它们。该产品团队正在开发一种新版本的OCR,具有更好的手写识别准确性。
感谢-xin Microsoft Azure表单识别器团队
https://stackoverflow.com/questions/62905067
复制相似问题