PyTesseract image_to_data函数无法识别我的图像_pytesseract无法识别图像_为什么pytesseract无法识别此图像？ - 腾讯云开发者社区

、、

是否有一种方法可以获得由trust rate产生的OCR输出的Pytesseract？我所说的信任率是OCR输出的正确百分比。示例： text = pytesseract.image_to_string(editedImage) 对于这个文本字符串，如果可能的话，我还想显示信任率。编辑:我尝试了image_to_data，但是我得到了一个错误 print(pytesseract.image_to_data(Image.open('test.png'))) Traceback (most recent call last): File "/usr/lib/

浏览 0提问于2018-02-18得票数 4

2回答

如何从此图像中只提取粗体文本？

、

我正在寻找一种方法/算法使用OCR (如Tesseract)只从图像中提取粗体文本。我编写的Python代码已经可以识别小写字母和数字，但它不能区分粗体文本和非粗体文本。有人有什么想法，例如，对图像进行预处理或后处理才能使其工作吗？我不是在寻找编码或实现的帮助，只是为了一个算法的想法。作为另一个工具，我可以使用OpenCV。为了说明起见，这是我的当前代码： import cv2 import sys import numpy as np from PIL import Image import pytesseract if __name__ == '__main__':

浏览 0提问于2019-02-12得票数 0

1回答

如何使pyTesseract只从图像中获取数字

、、、、

我一直在尝试做一个sudoku解算器，以png的形式输入sudoku游戏。我试着把图像中的数字转换成数字，这样我就可以把它们放到列表中，然后再实现一个算法。然而，pyTesseract并没有清楚地找到图像中的数字，并且给出了不可靠的读数，尽管这些数字看起来非常清晰，而且图像是由计算机生成的。我怎样才能强迫pyTesseract只寻找数字，并得到数字以及他们的位置正确。您可以在下面的图像中看到示例sudoku图像以及代码。您还可以在下面的url中查看代码：

浏览 7提问于2022-03-09得票数 0

2回答

从图像中识别矩阵

、、、、

我已经编写了算法来解决pluszle游戏矩阵。输入是numpy数组。现在我想从屏幕截图中识别矩阵的数字。识别输出应该是numpy数组。 array([[6, 2, 4, 2], [7, 8, 9, 7], [1, 2, 4, 4], [7, 2, 4, 0]]) 我试着把最后的图像喂给 from PIL import Image import pytesseract pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe

浏览 21提问于2022-12-04得票数 0

1回答

如何将背景的一部分颜色由黑色变为白色？

、、

我一直在JPEG光字符识别和转换的PyTesseract格式，以光学字符识别的图像。图像的一部分有黑色背景和白色文本，Tesseract无法识别，而我的图像的所有其他部分都可以很好地阅读。有没有办法改变图像中有黑色背景的部分？我尝试了一些SO资源，但似乎没有帮助。我使用的是Python3、Open CV版本4和PyTesseract

浏览 13提问于2019-02-07得票数 1

1回答

如何从图像中获取文本？

、、

我正在尝试从地图中获取坐标，我使用Pytesseract将坐标部分应用到OCR上，但我无法获得坐标。这是指向图像"“的链接，我尝试过这个脚本： import numpy as np import cv2 as cv %matplotlib inline from matplotlib import pyplot as plt img = cv.imread('a.jpg') corped = img[460:700, 700:1000] image=cv2.cvtColor(corped,cv2.COLOR_BGR2GRAY) se=cv2.getStructuring

浏览 0提问于2021-02-26得票数 0

1回答

用于低分辨率img的pytesseract

、、、

光盘:我总在OCR和寻找机会，从图像转换为文本低分辨率图像新手。我已经尝试过用不同的conf进行pytesseract，但它仍然无法将图像转换为文本。据我所知，在向tesseract发送图像之前，我需要进行某种预处理，我检查了相关问题中的一些选项，但仍然无法使用pytesseract进行文本识别。为了成功的文本识别，可以进行任何预处理或tesseract调优吗？任何python代码示例都很感谢，谢谢！ pytesseract.image_to_string(img, lang='eng') 我没有办法提高源图像的质量。

浏览 2提问于2020-04-19得票数 0

1回答

pytesseract无法使用OCR识别图片中的数字

、

我正在尝试使用Python-tesseract通过光学字符识别(OCR)从这个(picture)中提取数字。由于某些原因，pytesseract无法识别数字，我不完全理解原因(数字之间的距离？)。有人可以帮助我理解如何正确地从这张图像中提取数字吗？下面的代码没有打印任何内容 im.save("sudo.png") text = pytesseract.image_to_string(im) print(text)

浏览 63提问于2019-03-15得票数 0

2回答

有人能解释一下为什么pyautogui TypeError:不能解包不可迭代的NoneType对象吗？

我正在尝试创建一个机器人，它可以识别屏幕上的图像，并能够点击该图像。但是，当提示机器人单击图像时，系统会提示我TypeError: cannot unpack - am object。 import pyautogui as pg import keyboard import time import pytesseract as tess from PIL import Image if pg.locateOnScreen('follow1.png', confidence=0.5) != None: pg.click('follow1.png') 然

浏览 6提问于2020-10-13得票数 0

1回答

pytesseract无法识别二值化图像中的数字

、、

我目前在pytesseract中遇到了一个问题，软件无法检测到此图像中的数字：出于某些原因，pytesseract不想识别此图像中的数字。有什么建议吗？下面是我的代码： import pytesseract from PIL import ImageEnhance, ImageFilter, Image img = r'/content/inv_thresh.png' str = pytesseract.image_to_string(Image.open(img), lang='eng', \ config='--psm

浏览 1提问于2019-10-11得票数 1

1回答

从图片python中识别明文

、、、

我用pytesseract从图像中识别文本 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 然后我使用下面的代码来识别文本 textImg = pytesseract.image_to_string(Image.open(imgLoc+"/"+imgName)) print(textImg) text_file = open(imgLoc+"/"+"oriText.txt", "w")

浏览 2提问于2019-05-25得票数 0

1回答

为什么pytesseract无法识别背景较暗的图像中的数字？

、、、

我有一段python代码，用来将图片中的文本转换为字符串，它确实适用于某些包含大字符的图像，但不适用于我现在正在尝试的只包含数字的图像。这是一张图片： ? 这是我的代码： import pytesseract from PIL import Image img = Image.open('img.png') pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract' result = pytesseract.image_to_str

浏览 100提问于2019-05-06得票数 12

回答已采纳

3回答

如何用Python提取和识别车牌号码？

、、、、

我曾尝试使用pytesseract与PIL合作，从车牌图像中识别车辆注册号。但我无法从这些图像中获取文本。代码： from PIL import Image from pytesseract import image_to_string img= Image.open('D://carimage1') text = image_to_string(img) print(text) 虽然这适用于正常扫描的文档，但它不适用于车辆号牌。示例图像1 示例图像2

浏览 0提问于2019-01-29得票数 3

2回答

即使输入文本，Tesseract OCR也提供了非常糟糕的输出。

、

我一直试图让tesseract OCR从预先裁剪的图像中提取一些数字，即使图像非常清晰，它也不能很好地工作。我试着四处寻找解决方案，但我在这里看到的所有其他问题都涉及到剪切或倾斜文本的问题。下面是我的代码示例，它试图读取图像并输出到命令行。 #convert image to greyscale for OCR im_g = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY) #create threshold image to simplify things. im_t = cv2.threshold(im_g, 0, 255, cv

浏览 5提问于2021-12-19得票数 3

回答已采纳

1回答

pytesseract不识别字母前面的符号

、、

尝试使用pytesseract读取几个文本块，但当符号位于单词之前或单词之间时，它无法识别符号。但是，当符号在数字前面时，它会识别这些符号。示例：图像上的'#test $test %test'打印错误的'Htest Stest Stest' 图像上的'#500 $500 %500'打印正确的'#500 $500 %500' 下面是我的代码： import cv2 import pytesseract from PIL import Image image = cv2.imread("

浏览 31提问于2021-10-19得票数 1

回答已采纳

1回答

使用pytesseract python模块识别图像中的文本

、、

我已经附上了与300DPI的图像。我使用下面的代码来提取文本，但是我没有得到任何文本。有人知道这个问题吗？ finalImg = Image.open('withdpi.jpg') text = pytesseract.image_to_string(finalImg)

浏览 0提问于2021-02-26得票数 0

1回答

pytesseract不识别图像中的字符。

、、

我正在尝试使用pytesseract，但是当我提供图像时，它不识别它。是因为图像小吗？如果是的话，最小尺寸应该是多少？它是否适合于识别从图像中分割出来的单个字符？ from PIL import Image import pytesseract image = Image.open(path) num = pytesseract.image_to_string(image) print(num) 这是一幅图像：

浏览 1提问于2018-05-30得票数 1

1回答

Pytesseract在同一个文件中跳过"1“而不是"10”。

、、、

我正在使用pytesseract和openCV来尝试识别一个数字表。我一直在努力调整图像的大小、重采样和重新保存其颜色，以使pytesseract更容易阅读。下面是我设法生成的图像。我的问题是，每当一个"1“连续出现时，pytesseract就无法认出它. 这是我试图读到的图片(一旦我应用了所有提到的处理)：这是守则的有关部分： from PIL import Image import pytesseract img = cv2.imread('test.jpg', 0) data = pytesseract.image_to_string(img) 这是输

浏览 3提问于2021-02-02得票数 0

回答已采纳

1回答

二值图像上的Tesseract OCR

、、、、

我有一个这样的二进制图像，我想在Python中使用tesseract ocr提取图像中的数字。我在图像上这样使用了pytesseract， txt = pytesseract.image_to_string(img) 但是我没有得到任何好的结果。我可以在预处理或增强中做些什么来帮助tesseract做得更好？我尝试使用East Text Detector对图像中的文本进行本地化，但它无法识别文本。如何在python中进行此操作？

浏览 9提问于2019-05-21得票数 2

2回答

Tesseract -理应很容易的图像被证明是错误的数字

、

请在下面找到一些tesseract无法正确识别的图像。 47被认为是"4]“。 55被认为是"S55“。 90被认为是“智商”。我认为图像非常好，应该很容易被Tesseract识别。但结果证明是错误的。我使用的代码如下所示。 import cv2 import pytesseract from PIL import Image import glob for i in glob.glob('*.png'): img = cv2.imread(i, 0) tessdata_dir_config = '--tes

浏览 0提问于2017-09-12得票数 1

1回答

与Tesseract几乎相同的图像中的不同文本

、、

我有两幅几乎完全相同的图片： other.png title.png 我使用Python脚本来使用Tesseract提取文本： import pytesseract import cv2 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' def process(path): image = cv2.imread(path) image = cv2.bitwise_not(image) # cv2.imsho

浏览 4提问于2020-05-25得票数 0

2回答

Pytesseract OCR错误文本识别

、、

当我使用Pytesseract识别该图像中的文本时，Pytesseract返回7A51k，但该图像中的文本是7,451 k。如何用代码来解决这个问题，而不是提供更清晰的源代码映像呢？我的代码 import pytesseract as pytesseract from PIL import Image pytesseract.pytesseract.tesseract_cmd = 'D:\\App\\Tesseract-OCR\\tesseract' img = Image.open("captured\\amount.png") string

浏览 3提问于2021-01-21得票数 1

回答已采纳

1回答

如何利用pytesseract在梯度背景下检测彩色文本

、、

我目前正在研制一个小型OCR机器人。我几乎所有的事情都要做，现在我正在努力改进OCR。具体来说，它有两个问题:相同颜色梯度上的橙色/红色文本，以及由于某种原因，"1/1“的前1。遗憾的是，我还没有找到在我的案子中起作用的东西。我做了一个小测试映像，它由多个图像组成，如下所示：正如您所看到的那样，渐变会产生一个大到足以与第一个单词(参见“学徒”)重叠的blob，从而导致垃圾。我尝试了很多不同的方法，尝试过阈值，模糊，腐蚀，膨胀，用膨胀法检测盒子等等，但是没有什么效果好。我唯一能摆脱的方法就是使用一个自适应阈值。但遗憾的是，我无法通过输出图像获得好的结果。如果有人知道如何使OC

浏览 4提问于2022-04-11得票数 0

回答已采纳

1回答

如何使用pytesseract从pdf文件的图像中提取文本

、、

我正在尝试使用下面的代码从pdf文件的图像中提取文本。PDF文件是合同文档，是合同的扫描副本。pdf文件中的所有页面都是图像。当我尝试使用下面的代码提取数据时，我得到一个错误，说它无法读取文件/无法识别图像文件。 try: import Image except ImportError: from PIL import Image import pytesseract pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'

浏览 3提问于2018-09-27得票数 0

1回答

易读文本不能被tesseract识别

、、、、

我使用了下面的 of EAST (高效、准确的场景文本检测器)来识别和绘制多幅图像中文本周围的包围框，它工作得非常好！然而，OCR的下一个步骤(我正在使用pytesseract来提取这些图像的文本并将它们转换为字符串)是可怕的失败。使用--oem和--psm的所有可能配置，我无法让pytesseract检测到看起来非常清晰的文本，例如：识别的文本在图像下面。虽然我已经应用了对比度增强，也尝试了膨胀和侵蚀，但我无法让识别文本。这只是许多图片中的一个例子，其中的文本更大、更清晰。任何关于转换、信任或其他库的建议都是有帮助的！更新:在尝试了高斯模糊+ Otso阈值处理之后，我能够在白

浏览 1提问于2020-08-15得票数 1

回答已采纳

1回答

无法在pytesseract中获取作为单个单词的第二行名称

、

我正在尝试使用pytesseract从图像中读取文本。图片在这里， ? 。使用代码，我能够读取文本，但如果有两行列出的城市名称，它将失败。例如，在图像中，大交叉口或蒙特利湾国家海洋保护区预计将被识别为单个单词，但它们正在进入新的行。代码： act_image = cv2.imread('C:/Users/a463129/Downloads/chromedriver_win32/images/capture.png') dimension = act_image.shape image = act_image[0:dimension[0], 500:dimension[1]

浏览 20提问于2020-07-02得票数 0

回答已采纳

1回答

如何提高Pytesseract提取数字的准确性

、、、

我正在测试Pytesseract，并使用它提取如下所示的数字。图像质量相当不错(200 dpi)。然而，当我运行pytesseract时，它给出了结果456-/8-0000，其中数字7被错误地识别为'/‘。虽然"/“显然与数字7有一些相似之处，但鉴于图像的高质量，我仍然对此感到惊讶。我都试过了 pytesseract.image_to_string(img) 和 pytesseract.image_to_string(img, lang='eng', config='--psm 13 --oem 2 -c tessedit_char_whi

浏览 0提问于2019-07-02得票数 0

1回答

如何在小图像中使用pytesseract提高手写文本的识别率？

、、、

我想使用pytesseract库进行手写文本识别，以读取平均维数为43 * 45像素的图像中的数字字符。以下示例图像：预期结果： 9 1 4 我想从图像中得到一个数字字符。我在下面尝试过这段代码 import pytesseract # loop through images print(pytesseract.image_to_string("text.jpg", config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')) 但真正的结果是，我得到的准确率不到50%，甚至更低

浏览 6提问于2020-06-26得票数 4

2回答

如何在python中使用pytesseract和opencv-python识别其他较大对象下的变形文本？

、、、、

我使用pytesseract来识别文本，如下所示 td = pytesseract.image_to_data(img, output_type=Output.DICT) tn_boxes = len(td['level']) for o in range(0, tn_boxes): text = td['text'][o] print(text) 我只是使用一个简单的逻辑Examples来建立一个detect keyword 'Example no.' find it's end point keyword 'S

浏览 2提问于2020-06-09得票数 0

回答已采纳

1回答

如何让pytesseract正确读取slahed 0

、、、、

我正在试着读取图像上的电话号码。由于图像非常清晰，我没有应用任何预处理，但pytesseract有时无法正确识别0。我试着训练相似的字体，但得到了相同的结果。this image就是一个例子我的代码非常简单： image=Image.open('Fotolar/0.png') custom_config = r'--oem 3 --psm 6' pytesseract.image_to_string(image,config=custom_config) 我得到的结果是：'9543 684 9993‘ 我试着对我的图像进行微调，但我不能这样做，因为所

浏览 19提问于2020-07-22得票数 0

回答已采纳

1回答

Python3图像识别错误

如何在此处识别此图像： (4412) digital 我的代码是： from PIL import Image import pytesseract qq=Image.open('d://frame4.jpg') text=pytesseract.image_to_string(qq).strip() #使用image_to_string识别验证码 print(text) 我希望它用英文打印，而不是用数字打印。

浏览 0提问于2016-12-01得票数 0

1回答

如何用PyTesseract从图像中提取单个字母？

、、、

我正在自学python，并试图编写一个简单的程序来识别图像中的字母。字母不是句子或段落的形式。我正在尝试使用cv2 + pytesseract进行检测，但我似乎就是无法让它可靠地工作。我开始怀疑我在工作中使用了错误的工具，但我找不到任何其他工具来帮助我。这是我的参考图像，其中包含我要提取的字母： ? 理想情况下，我想要的字母和坐标的每个字母(边界框)。我已经能够对图像应用遮罩和阈值，以获得以下结果： ? 但是我被Pytesseract卡住了，它不能可靠地给我单独的字母，甚至是正确的字母。这是我的控制台输出... $ py main.py --image test.png D

浏览 29提问于2020-04-21得票数 0

回答已采纳

1回答

(OCR) Tesseract不识别简单数字

、、、

我使用PyTesseract从包含垂直分隔价格(每行一个价格)的多个图像中提取信息，水平对齐如下图像一样： Tesseract无法用这样的图像提取可靠的文本，因此，必须进行图像处理： 4x;Binarization"Bolding";Gaussian模糊图像缩放；这会产生以下图像： Pytesseract能够成功地提取其信息(使用PSM-6)，从而生成包含以下内容的字符串： 96,000,000 94,009,999 90,000,000 85,000,000 78,000,000 70,000,000 66,000,000 然而，当Pytesseract

浏览 4提问于2022-10-05得票数 0

1回答

Pytesseract (OCR)不识别这个(很明显)图像

、

为什么pytesseract不识别 import pyautogui, pytesseract from PIL import Image im = Image.open('test.png') print(pytesseract.image_to_string(im)) 奇怪的是，如果文本为+1.5或超过1，则相同的图像工作，但它不适用于任何负数或0到1之间的任何东西。

浏览 3提问于2016-11-09得票数 1

回答已采纳

1回答

pytesseract不能处理一位数的图像

、

我有使用pytesseract的代码和完美的工作，只有当我试图识别的图像是0到9时，才不工作。如果图像只有一个数字，不要给出任何结果。这是我正在做的图像样本这是我使用的代码 import pytesseract varnum= pytesseract.image_to_string(Image.open('images/table/img.jpg')) varnum = float(varnum) print varnum 谢谢！有了这段代码，我就能读懂所有的数字 import pytesseract start_time =

浏览 3提问于2015-07-26得票数 8

1回答

PIL.UnidentifiedImageError：_cannot标识图像文件

、、

我有下面的代码，它适用于大多数图像类型。但由于某些原因，它不适用于只包含1页和pdf的tiff图像。我有这个错误：回溯(最近一次调用)：文件"/Users/fatiatravaille/Downloads/ocr_json/test.py"，第8行，在"/Library/Frameworks/Python.framework/Versions/3.9/lib/python3.9/site-packages/PIL/Image.py"，= Image.open(r './radio_lomb_300.tiff‘)文件UnidentifiedImage

浏览 170提问于2021-09-23得票数 0

1回答

NameError:未定义名称“”pytesseract“”

、、、、

无法识别Pytesseract。我已经尝试了在线文档中记录的所有修复，包括将tesseract OCR添加到我的Path变量中，将pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'命令路径整合到我的脚本中，卸载并重新安装pytesseract和tesseract。

浏览 67提问于2020-03-06得票数 2

2回答

为什么tesseract不会检测到这个字母？

、

我正在尝试检测这封信，但它似乎无法识别它。 import cv2 import pytesseract as tess img = cv2.imread("letter.jpg") imggray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) print(tess.image_to_string(imggray)) 这是有问题的图像：

浏览 0提问于2020-12-05得票数 0

1回答

使用tesseract从扫描的pdf文件中提取文本为csv

、、、、

我需要帮助从扫描的pdf提取文本。我试过用pymupdf和枕头及pytesseract来提取它，但是我没有得到正确的结果，有一些文本被错误地返回。我试着增加锐度和亮度，但仍然没有取得好的效果。我已经使用OpenCV检查了许多答案，但我对OpenCV相当陌生。请帮帮忙。 def pdf_to_text(pdf_file,text_file_name,rotate_pdf=False,adj_sharpness=False,adj_contract=False,adj_brightness=False): try: doc = fitz.open(pdf_file)

浏览 4提问于2022-03-16得票数 1

1回答

为什么pytesseract无法识别此图像？

、、

我正在尝试用tesseract来识别python中的单位数。我的代码是： import numpy as np from PIL import Image from PIL import ImageOps import pytesseract import cv2 def predict(imageArray): pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe" newImageArray = Image.open(imageArra

浏览 33提问于2020-03-01得票数 0

2回答

如何在Python中读取图像中文本的颜色

、

我正在建设一个可以从图像中读取文本的项目。我还需要确定这篇文章是用哪种颜色写的。图像是由计算机生成的，并且总是由数字组成。我正在使用PyTesseract进行光学字符识别检测。谁能给我提个建议，我该怎么做？ Sample Image 例如，我需要python代码中的信息，比如429.05 Green 我的代码如下所示 import pytesseract import cv2 pytesseract.pytesseract.tesseract_cmd = "C:\\Program Files\\Tesseract-OCR\\tesseract.exe" img = cv2.

浏览 37提问于2020-08-02得票数 4

回答已采纳

1回答

PyTesseract无法识别图像

、、

我目前面临着pytesseract的一个问题，在这个问题上，软件无法检测到这个图像中的数字：这是从一个更大的图像，应用阈值滤波器。出于某种原因，pytesseract不想识别这张图片中的6。有什么建议吗？这是我的代码： image = #Insert raw image here. My code takes a screenshot. image = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY) image = cv2.medianBlur(image, 3) rel, gray = cv2.threshold(image, 127, 255, cv2

浏览 3提问于2017-11-19得票数 2

回答已采纳

1回答

从图像pytesseract解析数字

、

我正试图从图像中解析一个数字。下面是图像的一个例子我首先尝试提取所有文本，以查看最终结果，但是代码没有识别出所需的数字--这是我的尝试 from PyPDF2 import PdfFileWriter, PdfFileReader import fitz, pytesseract, os, re import cv2 def readNumber(img): img = cv2.imread(img) gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) txt = pytesseract.image_to_string(g

浏览 1提问于2022-03-01得票数 0

回答已采纳

1回答

不从图像中获取印地语文本

、、、、

我想使用pytesseract库从图像中识别印地语文本。我试过的下面的脚本可以识别整个文本，但我不会使用印地语。它只识别典型的欧洲/美国字符： # -*- coding: utf-8 -*- from PIL import Image import pytesseract pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract' #im = Image.open("/tesserocr/hindisample.png") #im =

浏览 0提问于2018-05-07得票数 2

1回答

tesseract只从图像中检测到4个单词

、、、、

我有非常简单的python代码： import cv2 import pytesseract pytesseract.pytesseract.tesseract_cmd = 'C:\\Tesseract-OCR\\tesseract.exe' img = cv2.imread('1.png') img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) hImg,wImg,_ = img.shape #detecting words boxes = pytesseract.image_to_data(img) for x,b in

浏览 2提问于2021-11-13得票数 1

回答已采纳

1回答

低质量数字图像OCR的预处理方法？

、、、、

我目前正在做一个项目，将读取一个数独网格的图像，检测网格，识别数字，解决难题，并将解决方案覆盖在图像上。为了识别数字，我将网格划分为n*2个图像，其中每个图像都是一个单独的网格(例如： )，并将它们运行到pytesseract中。然而，我的图像都没有检测到任何文本，即使它只是一个没有噪声/边框/等的数字图像。我尝试了常用的平滑图像的方法，各种阈值方法，调整图像大小，反转图像，以及将数字裁剪到边界框中，但这些方法似乎都不起作用。我已经在其他图像上测试了我为pytesseract编写的代码，这些似乎都工作得很好，只有我的图像不能工作。有没有人能就我可以尝试的内容和/或为什么我的图像看起来不容易

浏览 0提问于2018-10-10得票数 3

1回答

Tesseract-OCR不识别数字

、、、、

我使用Tesseract OCR识别我下面的图片(这是一个图像仪表，电)，但它不能工作。我不允许使用机器学习或深度学习。还有其他技术可以用来解决我的问题吗？请给我一个向导。感谢您的阅读。这是我的根图像：我处理过的这张图像必须识别数字这是我的代码： import cv2 import pytesseract as pts pts.pytesseract.tesseract_cmd = r'C:\Users\Thep Ho\AppData\Local\Programs\Tesseract-OCR\tesseract.exe' img = cv2.imread(&

浏览 4提问于2020-11-29得票数 1

1回答

Pytesseract没有在Ubuntu上看到Tesseract

、、、

我试图从图像中识别文本，但是在运行脚本时，会弹出一个错误 raise TesseractNotFoundError() pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information. 代码： import cv2 import pytesseract img = cv2.imread('1.png') img = cv2.cvtColor(img, cv2.

浏览 11提问于2022-10-07得票数 -1

2回答

pytesseract无法从图像识别复杂的数学公式

、、

我在python中使用pytesseract模块，pytesseract从图像中识别文本，但不处理包含复杂数学公式的图像，如根下、派生、积分数学问题或方程。代码2.py # Import modules from PIL import Image import pytesseract import cv2 # Include tesseract executable in your path pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe" # C

浏览 10提问于2020-04-08得票数 1

1回答

Python:检测图像中的大数字

、、、、

我目前的工作是在一个在线纸牌游戏中识别游戏板的相关方面。我已经通过OpenCV的SIFT和FlannBasedMatcher来根据图片识别卡片了。SIFT适用于识别卡的费用，但我认为简单地使用它来识别数字效率很低。由于数字的性质，Tesseract似乎无法工作，而OpenCV模板匹配由于数字被旋转而无法工作。有什么建议吗？ ? 编辑:添加了未处理的图像 ? 编辑2:我试过在正确旋转的卡片上使用pytesseract，但它不能给出我处理的任何准确结果。下面是返回值： paw PoE O，Mls OS， a) ae» 如下图所示： ?

浏览 27提问于2020-12-05得票数 0