首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Tesseract不识别单个字符

Tesseract不识别单个字符
EN

Stack Overflow用户
提问于 2012-03-09 09:55:32
回答 4查看 29.8K关注 0票数 22

如何代表:

  1. 用油漆(任意大小)创建新图像
  2. 将字母A添加到此图像中
  3. 尝试识别-> tesseract将找不到任何字母
  4. 将此字母复制粘贴到此图像5-6次。
  5. 试着识别-> tesseract会找到所有的字母

为什么?

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2013-12-03 13:23:23

您必须将“页面分割模式”设置为“单个字符”。

例如,在Android中,您可以执行以下操作:

代码语言:javascript
运行
复制
api.setPageSegMode(TessBaseAPI.pageSegMode.PSM_SINGLE_CHAR);
票数 22
EN

Stack Overflow用户

发布于 2018-10-12 09:14:45

进行这种配置的python代码如下所示:

代码语言:javascript
运行
复制
import pytesseract
import cv2
img = cv2.imread("path to some image")
pytesseract.image_to_string(
     img, config=("-c tessedit"
                  "_char_whitelist=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"
                  " --psm 10"
                  " -l osd"
                  " "))

--psm标志定义页面分段模式。

根据“文件”,10的意思是:

将图像视为单个字符。

因此,要识别单个字符,只需使用:--psm 10标志。

票数 15
EN

Stack Overflow用户

发布于 2012-06-05 07:13:58

您需要将Tesseract的页面分割模式设置为“单字符”。

票数 10
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9632044

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档