首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Pytesseract不识别图像中的简单文本

Pytesseract不识别图像中的简单文本
EN

Stack Overflow用户
提问于 2021-09-20 06:45:32
回答 1查看 354关注 0票数 4

我想认出这样的图像:

我使用以下配置:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
config="--psm 6 --oem 3 -c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ,."

但是,当我试图转换它时,我得到以下信息:

1581 1 W

我认为图像非常清楚地显示了所写的内容,并且认为pytesseract有一个问题。你能帮上忙吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-09-20 16:15:15

在执行OCR之前,对图像进行预处理以获得二进制图像似乎是可行的。您还可以尝试调整图像的大小,以便看到更多的细节。

结果

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
158.1
1
IT
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

# Grayscale and Otsu's threshold
image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

# Perform text extraction
data = pytesseract.image_to_string(thresh, lang='eng', config='--psm 6')
print(data)

cv2.imshow('thresh', thresh)
cv2.waitKey()
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69256402

复制
相关文章
使用 Python 和 Tesseract 进行图像中的文本识别
在日常工作和生活中,我们经常遇到需要从图片中提取文本信息的场景。比如,我们可能需要从截图、扫描文件或者某些图形界面中获取文本数据。手动输入这些数据不仅费时费力,还容易出错。这时,自动化的 Optical Character Recognition(OCR,光学字符识别)技术就能派上用场。
运维开发王义杰
2023/09/19
9060
使用 Python 和 Tesseract 进行图像中的文本识别
python 技术篇-3行代码搞定图像文字识别,pytesseract库实现
我们需要 pillow 和 pytesseract 这两个库,pip install 安装就好。 还需要安装 Tesseract-OCR.exe 然后配置下就好了。 具体的环境配置方法请看 python 技术篇-使用pytesseract库进行图像识别之环境配置
小蓝枣
2020/09/23
1.6K0
python 技术篇-使用pytesseract库进行图像识别之环境配置
我们需要 pillow 和 pytesseract 这两个库,pip install 安装就好了。 还需要安装 Tesseract-OCR.exe 然后配置下就好了。 Tesseract-OCR.exe获取地址:小蓝枣的资源仓库,提取码:c51p
小蓝枣
2020/09/23
8830
pytesseract 识别率低提升方法
下载地址https://github.com/tesseract-ocr/tessdata
小小咸鱼YwY
2020/06/19
5.6K0
python opencv+pytesseract 验证码识别
原文链接:https://yetingyun.blog.csdn.net/article/details/108160915 创作不易,未经作者允许,禁止转载,更勿做其他用途,违者必究。
叶庭云
2022/05/09
8900
python opencv+pytesseract 验证码识别
python opencv+pytesseract 验证码识别
识别验证码,需要先对图像进行预处理,去除会影响识别准确度的线条或噪点,提高识别准确度。
叶庭云
2020/09/17
3K0
python  opencv+pytesseract   验证码识别
python图片文本识别的简单实现
http://blog.sina.com.cn/s/blog_628cc2b70101cjvp.html
py3study
2020/01/09
2.8K0
Python OCR库:自动化测试验证码识别神器!
在接口自动化工作中,经常需要处理文字识别的任务,而OCR(Optical Character Recognition,光学字符识别)库能够帮助我们将图像中的文字提取出来。Python中有几个常用的OCR库,包括pyocr、pytesseract和python- tesseract、EasyOCR。本文将对它们进行比较,并提供一些示例代码来演示它们在实际接口自动化工作中的应用。
测试开发技术
2023/09/11
5.5K0
Python OCR库:自动化测试验证码识别神器!
HTMl网页中的文本和图像
JaneYork
2023/10/11
2390
小妙招:让图像会说话,字字清晰
人对图像的感知能力很强,所以图文很多,但是我们的认知却更多的用文字去传达;所以我们常常苦恼:
herain
2022/04/27
1.1K0
小妙招:让图像会说话,字字清晰
基于图像文字识别技术处理文本按钮
在之前的基于vision-ml模型训练框架改造以及实际场景应用识别弹窗,我们基于模型训练去处理我们的弹窗,但是呢,在一些界面弹窗是一样的,但是,文字是不一样的,那么我们呢怎么根据文字的不同去处理不同的弹窗呢?本文带你揭秘。
雷子
2021/12/09
1.6K0
基于图像文字识别技术处理文本按钮
Selenium&Pytesseract模拟登录+验证码识别
1 图像采集:就直接通过HTTP抓HTML,然后分析出图片的url,然后下载保存就可以了
测试开发社区
2019/09/20
2K0
Selenium&Pytesseract模拟登录+验证码识别
Focusing Attention Network(FAN)自然图像文本识别 学习笔记
对于一些复杂的或者质量低的图像,现有的基于注意力(attention-based)的方法识别效果很差,我们研究发现其中一个主要的原因是使用这种注意力模型评估的排列很容易损坏由于这些复杂或质量低的图像。换句话说,注意力模型(attention model)不能精确地联系特征向量与输入图像中对应的目标区域,这种现象称为attention drift。为了解决这个问题,本文提出了一种新的方法,称为FAN(Focusing Attention Network)来精确地识别自然图像中的文本。FAN主要由两个子网络组成:AN(attention Network)和现有方法一样,用于识别目标字符;FN(Focusing Network)通过检查AN的注意区域是非在图像中目标字符的正确位置,然后自动地调整这个注意点,下图直观地展示了这两个网络的功能。
Natalia_ljq
2020/06/03
1K0
Focusing Attention Network(FAN)自然图像文本识别 学习笔记
python pytesseract
python下没能成功安装pytesseract库 跑到在Mac下用brew安装tesseract,想绕一下让python调用shell进行图片识别 于是安装: ruby -e "$(curl -fs
程序员不务正业
2018/06/14
6410
图像识别在测试中的应用
介绍到这里会有人问,有了webdriver等ui自动化后为什么还要用图像识别呢?我认为主要有以下这几点:
霍格沃兹测试开发Muller老师
2022/06/13
8700
pytesseract+mechanize识别验证码自动登陆
https://digi.bib.uni-mannheim.de/tesseract/
py3study
2020/01/20
1.2K0
python下调用pytesseract识别某网站验证码
pytesseract最新版本0.1.6,网址:https://pypi.python.org/pypi/pytesseract
黯然销魂掌
2018/09/27
1.7K0
点击加载更多

相似问题

pytesseract不按预期识别文本?

13

使用pytesseract OCR识别图像中的文本

72

Python用pytesseract识别简单图像中的数字

13

使用pytesseract python模块识别图像中的文本

10

pyTesseract识别文本模式

16
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文