我想获得扫描文档的方向。我看到了这篇文章Pytesseract OCR multiple config options我试着用--psm 0来获取方向。
target = pytesseract.image_to_string(text, lang='eng', boxes=False, \
config='--psm 0 tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz')
但我得到一个错误:
FileNotFoundError: [Errno 2] No such file or directory: '/var/folders/jy/np7p4twj4bx_k396hyc_bnxw0000gn/T/tess_dzgtpadd_out.txt'
发布于 2020-02-12 20:57:12
而不是写作正则表达式要从字符串中获取Output.DICT,请传递参数dict若要将结果作为
from pytesseract import Output
im = cv2.imread(str(imPath), cv2.IMREAD_COLOR)
newdata=pytesseract.image_to_osd(im, output_type=Output.DICT)
示例输出如下所示:使用dict键访问这些值
{
'page_num': 0,
'orientation': 90,
'rotate': 270,
'orientation_conf': 1.2,
'script': 'Latin',
'script_conf': 1.11
}
https://stackoverflow.com/questions/51823228
复制相似问题