提高屏幕截图上的Tesseract OCR准确率

文章/答案/技术大牛

发布

2回答

image-processing、ocr、tesseract、training-data

截图上的tesseract OCR给出了相当不稳定的结果。即使图像完全是黑色的，上面覆盖着白色文本，似乎也只有部分文本被正确识别。即使在我将图像调整为300dpi之后，准确率仍然很低，并且大多数文本都是胡言乱语。如前所述，问题的作者能够通过用他的字体训练tesseract引擎来获得几乎100%的准确率。我的图像中的字体是Arial。我怎样才能<

浏览 33提问于2019-06-19得票数 0

1回答

如何使用jTessBoxEditor提高文本识别的准确性？

python、ocr、tesseract、python-tesseract、pdf-extraction

我一直在尝试从扫描的pdf文档中提取数据。我已经将pdf文件转换为jpeg文件(我在下面附上了图像链接)，裁剪具有不同字体的单词和数字，合并为tiff文件，并使用jTessBoxEditor训练字体生成新的语言，我使用该语言在Tesseract-OCR中提取文件中的数据。但我无法提取准确的数据。tesseract-ocr的文本识别准确率很低。有没有人能提出一个提高准确率<

浏览 21提问于2020-08-31得票数 1

1回答

Tesseract-OCR:需要训练所有类型的样本吗？

ocr、tesseract

我想做一个应用程序，可以将打印的名片转换为文本。我了解到tesseract-ocr可以通过训练提高准确性。如果我希望每种类型的名片都有很高的准确率，我需要训练所有类型的名片吗？有数百种类型的名片具有不同的字体或格式。有没有其他方法可以在tesseract-ocr中达到高精度？

浏览 23提问于2016-01-22得票数 0

2回答

Google Cloud Vision OCR* API是否比Tesseract OCR API具有更高的准确性和性能*

tesseract、google-cloud-vision

我已经将Google Cloud Vision API集成到我的java应用程序中，以便从复杂格式的文档中进行文本识别。我的一位同事建议使用"Tesseract API".Can，请给出这两种API的区别，在准确性方面更好，还是比other.TIA更有优势

浏览 12提问于2017-08-08得票数 9

1回答

有人知道Tesseract* - OCR后处理/拼写检查是如何工作的吗？*

ocr、tesseract、python-tesseract

我对西班牙语使用tesseract-ocr (pytesseract)，当您将语言设置为西班牙语时，它可以达到非常高的准确率，当然，文本是西班牙语的。所以，我假设tesseract使用了许多后处理模型来进行拼写检查和提高性能，我想知道是否有人知道tesseract正在应用的这些模型中的一些(即编辑距离，噪声通道建模)。提前感谢！

浏览 6提问于2020-01-20得票数 0

1回答

我有一个问题，那就是如何用tesseract来取得更好的识别效果。我在用tesseract来识别序列号。串行麻木只包括一种字体类型，字符A，0-9，发生在不同的大小和长度.目前，我能够识别出大约40%的序列号图像正确无误。图像是通过手机摄像头拍摄的。因此，图像质量并不是最好的。特殊的问题字符是8/B，5/6。我的问题是:是否有人已经有经验，在获得更好的识别结果与培训？要想取得好的</em

浏览 2提问于2015-06-30得票数 3

1回答

如何在小字体情况下获得准确的结果

ocr、tesseract、tess4j

我正在尝试使用Tesseract 3.02从应用程序中读取文本，用于验证目的(自动化测试)。如果字体很小(8到10)，它总是给我错误的结果。在将图像传递给tesseract之前，我遵循了下面提到的图像处理。1.图片转换为GrayScale格式。(图像格式JPG) 2.重新缩放图像3.转换为300DPI的图像在对图像进行预处理后，将其传递给tesseract。我有的大多数应用程序图像都是小字体的。我还确保了训练数据中的字体类型是可用的

浏览 1提问于2014-09-29得票数 1

1回答

经过训练的Tesseract仍然不够准确

java、tesseract

我正在训练tesseract，以便能够阅读TFT中的商店。所以我正在做的是用24张看起来像this的图片来训练它。在jTessBoxEditor的帮助下，选择了像this这样的盒子，每张图片有5个冠军和24张图片。但是，在执行以下代码时，结果并不十分准确，因为您可以看到here： File ImageFile = new File("image.png");instanc

浏览 191提问于2021-07-07得票数 1

1回答

提高安卓TessBaseAPI (Tesseract)字符识别准确率

android、ocr、tesseract

在以下的帮助下，我在我的项目中使用了TessBaseAPI。但是，使用500万像素的摄像头，他们的结果是50%到60%。我想提高我的OCR的准确度。VietOCR还使用tesseract进行光学字符识别；他们的结果令人惊叹，准确率超过90%。但是我的应用程序的准确性不是很好。

浏览 1提问于2012-07-20得票数 3

3回答

Tesseract OCR的高级用法

c++、ocr、tesseract

我正在为我正在编写的应用程序使用Tesseract OCR。我只是想从我不时获得的图片中识别出某些区域上的文本。目前，基本的调用是有效的api.SetPageSegMode(tesseract::PSM_AUTO); // SegmentationpixReadStreamBmp(pFile); fclose(pFi

浏览 2提问于2011-12-27得票数 1

回答已采纳

1回答

使用tesseract进行困难的文本识别

ruby-on-rails、ruby、image-processing、crop、tesseract

某些文本图像不能被tesseract识别。当使用OCRed时，上面的图像没有输出。而且有些图像的准确率达不到标准。我正在使用ruby on rails，为了实现tesseract OCR文本识别，我使用了'gem tesseract‘和一些代码。问题出在哪里?我怎样才能得到准确的输出？

浏览 4提问于2012-12-11得票数 1

1回答

如何从对话框和菜单复制文本？

dialog、japanese

我看到那里有在Windows中执行此操作的许多选项。Ubuntu有类似的选择吗？

浏览 0提问于2015-10-24得票数 9

回答已采纳

14回答

提高tesseract* OCR准确率的图像处理*

image-processing、ocr、tesseract

我一直在使用tesseract将文档转换为文本。文档的质量参差不齐，我正在寻找关于哪种图像处理可以改善结果的提示。我注意到，高度像素化的文本--例如传真机生成的文本--对于tesseract来说尤其难以处理--大概所有这些字符的锯齿状边缘都会让形状识别算法感到困惑。什么样的图像处理技术可以提高精度？我一直使用高斯模糊来平滑像素化的图像，并看到了一些小的改进，但我希望有一个更具体的

浏览 2提问于2012-02-28得票数 169

回答已采纳

1回答

Tesseract将0标识为q

optimization、tiff、tesseract、identification

我正在使用Tesseract OCR获取PDF文件中的独占数字字符串。PDF包含: 66600O3377.pdf，但Tesseract承认: 66600Q3377.pdf 

浏览 5提问于2013-12-19得票数 1

回答已采纳

5回答

在android中推荐的ocr库是什么？

android、ocr

请提供一些我们可以集成的android推荐的ocr库

浏览 6提问于2017-03-21得票数 0

回答已采纳

1回答

使用opencv的阈值图像(Java)

java、android、opencv、image-processing、tesseract

我正在为我的项目使用Opencv。Imgproc.adaptiveThreshold(imgGray, imgThreshold, 255, Imgproc.ADAPTIVE_THRESH_GAUSSIAN_C, Imgproc.THRESH_BINARY, 11, 2); 我只想要一个只有白色背景和黑色文本的二进制图像，没有黑色区域或噪声(我不喜欢使用Photo.fastNlMeansDenoising，因为它需要很多时间)。此外，我正在使用Tesseract进行日语识别，但准确率</e

浏览 2提问于2015-07-08得票数 11

回答已采纳

3回答

在iphone中实现tesseract OCR

iphone、ipad、ios5、xcode4.2、tesseract

我想在我的项目中实现手写识别。例如，当用户在屏幕上写入A时，屏幕应该显示A，我在google上搜索过，到目前为止我已经找到了，tesseract OCR，但是我不知道tesseract OCR是什么，以及如何在我的项目中实现这一点，可以有人给出tesseract OCR的演示教程，我不知道tesseract OCR是免费的还是付费的</

浏览 5提问于2012-02-03得票数 3

回答已采纳

2回答

在Tesseract* OCR中使用了什么阈值(二值化)算法？*

ocr、tesseract、adaptive-threshold

我正在工作的一个项目，需要准确的OCR结果的图像丰富的背景。因此，我比较两个OCR(其中之一是Tesseract)的结果，以作出我的选择。重点是预处理步骤，特别是图像二值化对结果有很大影响。我提取了其他OCR的二值化图像，并将其传递给Tesseract，使Tesseract的结果提高了30-40%。我有两个问题，你的</

浏览 6提问于2015-03-31得票数 6

回答已采纳

2回答

如何检测巨蟒图像的亮度和清晰度？

python-3.x、image-processing、ocr、python-tesseract

我尝试在图像上应用tesseract ocr，但在应用OCR之前，我希望提高图像的质量，从而提高OCR的效率。如何根据需要检测图像亮度，，增加或降低图像亮度。

浏览 1提问于2020-01-08得票数 1

2回答

对OCR图像进行倾斜和过滤

android、ocr、tesseract

我做了很多研究，还没有找到一个合适的解决方案。我正在编写一个Android OCR应用程序。我已经成功地加载了Tesseract和Leptonica，我正在成功地拍摄和处理图像，以及使用OCR将它们转换为文本。然而，识别准确率并不是很好。经过多次调整后，我们发现我们没有对图像进行足够的过滤、清洗和/或去偏斜来帮助Tesseract进行OCR处理。因此，我在互联网上寻找任何适合我的库或代码，并在Android上使用它，但无济于

浏览 2提问于2012-08-25得票数 3

回答已采纳

点击加载更多