我正在使用tesseract-ocr-3.01扫描许多表单。表单都遵循一个模板,所以我已经知道文本的区域/矩形在哪里了。
在使用命令行工具时,有没有办法将这些区域传递给tesseract?
发布于 2012-10-23 21:52:23
多亏了this thread,我找到了答案。
看起来tesseract支持uzn格式(在unvl测试中使用)。
在线程中:
使用参数"-psm 4“调用tesseract,并使用与图像相同的名称重命名uzn文件。
示例:如果我们有C:\input.tif和C:\input.uzn,我们这样做:
tesseract -psm 4 C:\input.tif C:\output发布于 2012-10-19 18:14:09
这可能不是一个最佳的答案,但这里有:
我不确定命令行工具是否有指定文本区域的选项。
您可以做的是在另一个平台上使用Tesseract包装器(EmguCV内置了Tesseract )。因此,您获得扫描的图像,裁剪出文本区域,并将它们逐个提供给Tesseract。这样,您还可以避免Tesseract的页面布局分析中的任何错误。
例如:
Image<Gray,Byte> scannedImage = new Image<Gray,Byte>(path_to_scanned_image);
//assuming you know a text region
Image<Gray,Byte> textRegion = new Image(100,20);
scannedImage.ROI = new Rectangle(0,0,100,20);
scannedImage.copyTo(textRegion);
ocr.recognize(textRegion); https://stackoverflow.com/questions/12971778
复制相似问题