Tesseract似乎不能处理数字

Tesseract是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，用于将图像中的文字转换为可编辑和可搜索的文本。然而，Tesseract在处理数字方面可能存在一些限制。

尽管Tesseract可以处理包含数字的文本，但它在处理纯数字图像时可能会遇到一些困难。这是因为Tesseract在处理数字时更侧重于识别文本中的字符和单词，而不是专门处理数字。因此，对于包含大量数字的图像，Tesseract的准确性可能会受到影响。

对于处理数字的需求，可以考虑以下解决方案：

使用图像预处理技术：在将图像输入Tesseract之前，可以使用图像处理技术对图像进行预处理，以增强数字的清晰度和对比度。这有助于提高Tesseract对数字的识别准确性。
使用专门的OCR引擎：除了Tesseract，还有其他一些专门用于数字识别的OCR引擎，如ABBYY FineReader等。这些引擎通常在数字识别方面表现更好，并提供更准确的结果。
结合使用机器学习和OCR：使用机器学习算法和OCR技术的结合，可以提高数字识别的准确性。通过训练模型来识别数字模式，并将其与OCR引擎结合使用，可以获得更好的结果。

总结起来，尽管Tesseract在处理数字方面可能存在一些限制，但可以通过图像预处理、使用专门的OCR引擎或结合机器学习和OCR来提高数字识别的准确性。

Tesseract似乎不能处理数字

tesseract

我遵循FAQ让Tesseract识别数字，但我得到的输出文件中只有一堆文本，尽管我的图像中只有数字。tesseract --tessdata-dir ./ .

浏览 3提问于2018-01-11得票数 3

回答已采纳

6回答

如何自定义Tesseract忽略噪声？

c#、opencv、character、ocr、tesseract

如果没有噪声(如你所见:数字行的顶部和底部有许多噪声)，Tesseract可以很好地识别数字。如果某些工具只能突出显示字符串线。对于Tesseract来说，它可以是非常好的输入。请帮帮我。谢谢大家。

浏览 0提问于2013-04-07得票数 5

3回答

有没有办法把tesseract用在个位数上？

tesseract

TL；博士看来，不能识别由一个数字组成的图像。有什么解决办法/理由吗？收割后的原始扫描如下：在我做了一些图像增强之后：如果它至少有两位数，它就能正常工作：我测试了另外几个数字：工作：如果有帮助的话，为了我的目的，对<

浏览 5提问于2014-12-20得票数 3

回答已采纳

1回答

pytesseract很难识别带有字体编号和7段数字的干净黑白图片(Python)

python、opencv、tesseract、python-tesseract

我一直在尝试让tesseract识别这张图片上的数字：但是当运行脚本时，输出为空，这意味着它不能有什么关于如何让它工作的提示吗

浏览 27提问于2018-08-09得票数 1

1回答

从PDF转换的学习tiff文档的错误

tesseract、ghostscript、imagemagick-convert、ephesoft

我们正在使用下面的命令与鬼怪脚本当学习其中一个不能工作的

浏览 0提问于2015-01-24得票数 0

回答已采纳

1回答

我已经成功地训练了tesseract 2.x来识别一些特定的字体。然而，似乎我的不能让tesseract同时识别所有这些字体--也就是说，源图像包含所有这些字体。目前，只能将一组tesseract数据放入tessdata文件夹(即一组具有一个训练字体的数据)。我知道tesseract 3.x可以正确处理多种字体--但是，我不能升级，因为没有与2.x版本的.NET绑定相同的.NET绑定。此外，我希望避免做所有的预处理和OCR本身的几

浏览 4提问于2012-10-13得票数 1

回答已采纳

1回答

Python:检测图像中的大数字

python、opencv、tesseract、image-recognition、sift

SIFT适用于识别卡的费用，但我认为简单地使用它来识别数字效率很低。由于数字的性质，Tesseract似乎无法工作，而OpenCV模板匹配由于数字被旋转而无法工作。有什么建议吗？ ? 编辑:添加了未处理的图像 ? 编辑2:我试过在正确旋转的卡片上使用pytesseract，但它不能给出我处理的任何准确结果。

浏览 27提问于2020-12-05得票数 0

1回答

基于Tesseract (tess4j)的OCR图像预处理的下一步

java、image-processing、ocr、tesseract、tess4j

我一直在尝试使用Tesseract来识别一系列图像中的一些数字，在寻找建议之后，我做了一些改进。到目前为止，我尝试了以下步骤：探索不同的Tesseract页面分割模式。这些数字在形状

浏览 4提问于2015-02-25得票数 2

回答已采纳

1回答

Tesseract-OCR不识别数字

python、opencv、image-processing、ocr、division

我使用Tesseract OCR识别我下面的图片(这是一个图像仪表，电)，但它不能工作。我不允许使用机器学习或深度学习。还有其他技术可以用来解决我的问题吗？请给我一个向导。感谢您的阅读。这是我的根图像：我处理过的这张图像必须识别数字这是我的代码：import pytesseract as pts pts.pytesseract.tesseract_cmd= r'C:\Users\Thep Ho\AppData\Local\Programs\Tess

浏览 4提问于2020-11-29得票数 1

1回答

如何提高tesseract的OCR结果

ocr、tesseract

我在tesseract处理数字的OCR时遇到问题。这张照片被认为是我使用-psm 6作为参数。有没有更好的方法来识别数字？我是否需要配置tesseract，或者是否需要对图像进行任何额外的预处理？

浏览 1提问于2016-02-21得票数 0

1回答

如何使用opencv和python仅从图像中提取文本部分？

python、opencv、roi、text-segmentation

这是对水表读数进行预处理后的图像。但每当我使用tesseract来识别数字时，它都不会给出适当的输出。因此，我只想提取/分割出数字部分作为感兴趣的区域，并将其保存在一个新的图像文件中，以便tesseract可以正确地识别它。我能够去除图像中的那些额外的噪声，这就是为什么我使用这个选项。

浏览 4提问于2016-04-19得票数 0

3回答

如何提高文本识别usingTesseract OCR。？

ios、objective-c、opencv、tesseract

我在I中实现了文本识别的tesseract ocr，对输入图像进行了预处理，给出了Tesseract method.It，识别效果较差。* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];

浏览 1提问于2014-08-28得票数 4

1回答

Pytesseract不适用于低分辨率图像

python、image-processing、ocr、python-tesseract

我试图从一幅分辨率为20x10的图像中读取数字。我知道这个问题可能是重复的。我已经完成了堆叠溢出的大部分问题，但似乎没有一个答案适合我。下面是我正在尝试阅读文本的图片：以下是我的当前代码：from PIL import Image img = Image.open(&

浏览 2提问于2021-10-26得票数 1

回答已采纳

4回答

tesseract不能识别一个数字图像

tesseract

我正在对python使用tesseract。它几乎可以识别我的所有带有2个或更多数字或字符的图像。但是tesseract不能识别只有一个数字的图像。我尝试使用命令行，但得到的响应是“空页面”。我不想用“只有数字”来训练tesseract，因为我也在识别字符。在未被tesseract识别的图像下面。

浏览 33提问于2018-03-27得票数 5

1回答

如何去除图像上的卷曲线

python、opencv、image-processing、tesseract

我使用tesseract ocr来识别图像上的文本。我对有卷曲线条的图像有问题。我尝试过各种方法，如阈值、高斯滤波、彩色提取等.但我不能移除它。我想删除这些行而不丢失数字。任何暗示或某种方向感都将受到极大的赞赏。提前谢谢你的帮助。

浏览 0提问于2018-04-23得票数 2

回答已采纳

1回答

带气量计的电阻式OCR

android、image-processing、tesseract

我正试图让Tesseract从一张气表单元的照片中识别数字。但它主要返回空页作为输出(例如，我使用Tesseract 3.02)。我想把Tesseract用于Android的OCR应用程序，所以我只是想看看Tesseract是否能够识别这样的数字。第一张照片是我在java程序中通过图像预处理所能得到的。如果我使用gimp并手动进行更多的调整，tesseract将识别它。但是我需要它来识别像1这样的图片。有什么我可以做的吗？->。

浏览 3提问于2013-05-03得票数 2

1回答

Tesseract Training -仅包含数字的新字体

ocr、tesseract、training-data

你好，我试着根据以下数字训练tesseract以获得新的字体：所有数字都在透明背景的png文件中提供。如果我用它创建一个box文件，训练它，等等--一切都很好！现在的问题是，同样的情况，但我想根据下面的图像训练tesseract：正如你所看到的，数字和位置是完全相同的，等等。与图1的唯一区别是，我使用了黄色背景，从现在开始，什么都不能用了。所以我的问题是，无论使用哪种背景，如何训练tesseract来识别这些数字？编辑2016-04-

浏览 12提问于2016-03-27得票数 4

5回答

与Tesseract相比，PaddleOCR的性能如何？

paddle-paddle

最近我遇到了PaddleOCR，我想知道这个OCR系统与Tesseract相比是怎样的。是否有可用的数据或基准？

浏览 163提问于2021-06-16得票数 6

回答已采纳

1回答

在给Tesseract之前，如何在图像中拼凑虚线？

python、opencv、image-processing、tesseract、text-recognition

我有一些数字值组成的屏幕图像。我想用Tesseract 4.0识别这些数字。然而，这些数字由虚线组成，如七段显示的线条.由于破折号，Tesseract无法识别这些值。我用吉普把那些虚线连成了一块。Tesseract几乎正确地识别了价值。我想用OpenCV做这件事。我怎样才能把虚线的数字连成一块呢？

浏览 1提问于2020-05-19得票数 0

回答已采纳

1回答

使用java不读取具有背景图像的文本和数字

java、ocr、tesseract

我尝试用tess4j(1.1)来读取图像，但无法读取那些有背景图像的数字/字符，所以我对图像和图像进行阈值处理，使之变为黑白，但问题仍然存在。所以我想知道我也在用神经网络寻找机会，但它似乎需要更多的时间。File imageFile = ne

浏览 13提问于2013-03-13得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Tesseract似乎不能处理数字

相关·内容

Tesseract似乎不能处理数字

如何自定义Tesseract忽略噪声？

有没有办法把tesseract用在个位数上？

pytesseract很难识别带有字体编号和7段数字的干净黑白图片(Python)

从PDF转换的学习tiff文档的错误

tesseract 2.x -同时使用多种字体

Python:检测图像中的大数字

基于Tesseract (tess4j)的OCR图像预处理的下一步

Tesseract-OCR不识别数字

如何提高tesseract的OCR结果

如何使用opencv和python仅从图像中提取文本部分？

如何提高文本识别usingTesseract OCR。？

Pytesseract不适用于低分辨率图像

tesseract不能识别一个数字图像

如何去除图像上的卷曲线

带气量计的电阻式OCR

Tesseract Training -仅包含数字的新字体

与Tesseract相比，PaddleOCR的性能如何？

在给Tesseract之前，如何在图像中拼凑虚线？

使用java不读取具有背景图像的文本和数字

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐