首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为什么pytesseract不能处理OSD模式?

为什么pytesseract不能处理OSD模式?
EN

Stack Overflow用户
提问于 2021-04-09 09:44:23
回答 1查看 1.2K关注 0票数 3

我不能在Ubuntu上的映像上运行pytesseract中的OSD模式。在windows上,此命令的工作方式类似于魅力:

代码语言:javascript
运行
复制
pytesseract.image_to_osd(image)

但是在对接图像中,它会导致以下错误。我想要实现的是使用OSD读取旋转信息。

代码语言:javascript
运行
复制
File "/usr/local/lib/python3.9/site-packages/pytesseract/pytesseract.py", line 263, in run_tesseract
raise TesseractError(proc.returncode, get_errors(error_string))pytesseract.pytesseract.TesseractError: (1, 'Tesseract Open Source OCR Engine v5.0.0-alpha-20210401 with Leptonica UZN file /tmp/tess__cujlspf loaded. Estimating resolution as 169 UZN file /tmp/tess__cujlspf loaded. Warning. Invalid resolution 0 dpi. Using 70 instead. Too few characters. Skipping this page Error during processing.')

Tesseract的安装是正确的,因为所有其他方法(如image_to_string )都在正常工作。令人惊讶的是,当我从终端直接呼叫OSD时,它可以工作。

代码语言:javascript
运行
复制
tesseract /images/1.jpg  output --psm 0
# cat output.osd
Page number: 0
Orientation in degrees: 0
Rotate: 0
Orientation confidence: 5.69
Script: Cyrillic
Script confidence: 0.10

在Pytesseract中有什么bug或其他解决方法吗?旋转信息不包括在任何其他的Tesseract方法,只有在这个OSD。非常感谢

EN

回答 1

Stack Overflow用户

发布于 2021-10-05 08:08:28

通过将config参数添加到方法调用中,我找到了解决方案:

代码语言:javascript
运行
复制
pytesseract.image_to_osd(file_name,config='--psm 0 -c min_characters_to_try=5')

这解决了误差,我可以得到角度数据。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67018785

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档