tesseract文字识别_tesseract文字识别demo_tesseract识别白字 - 腾讯云开发者社区

c#、ocr、tesseract

我在我的项目中使用Tesseract来转换我从法国报纸上扫描过的图像。我想知道我是否需要训练Tesseract，以便识别法语字体和这种语言的规范，如“插入”、“回旋口音”等。

浏览 5提问于2014-04-23得票数 1

回答已采纳

1回答

Tesseract的替代方案

python、opencv、ocr、tesseract

在Python或OpenCV中，有没有其他软件或库可以替代Tesseract进行字符识别？有什么建议的字符识别方法可以用Python实现吗？谢谢

浏览 0提问于2017-10-23得票数 4

1回答

你能用图像而不是文字和字体来训练教师吗？

ocr、tesseract、training-data

在tesseract 中，解释了一种使用示例文本和字体进行训练的方法。我使用了jTessBoxEditor，但工作原理与tesseract培训工具非常相似。我得到了一些可以接受的结果，但我想最好的解决方案是用它必须识别的实际图像来训练测试员。因为我只需要识别数字，我就可以手工切割每一个数字，也许每个数字的很多版本，并且用这些图像训练，甚至用手设置盒子。有办法这样做吗？

浏览 3提问于2018-02-25得票数 5

3回答

我在I中实现了文本识别的tesseract ocr，对输入图像进行了预处理，给出了Tesseract method.It，识别效果较差。步骤： 1.侵蚀功能 2.扩张功能 3.Bitwise_not函数 Mat MCRregion; cv::dilate ( MCRregion, MCRregion, 24); cv::erode ( MCRregion, MCRregion, 24); cv::bitwise_not(MCRregion, MCRregion); UIImage * croppedMCRregion = [self UIImageFromCVMat:MCRreg

浏览 1提问于2014-08-28得票数 4

1回答

如何分割图像上的连通字符，以便进行进一步的OCR？

java、opencv、ocr、tesseract、text-segmentation

我正在Java (使用OpenCV库)上使用Tesseract (这种自定义字体的预培训)为OCR准备图像。有一个蓝色文本的图像，通过OpenCV inRange()方法对图像进行大小调整和二值化之后，我得到了黑白图像，但是有些字母是连在一起的，而且Tesseract有时会在它们上出错。此外，还有几个问题:原始文本很小，边框像素总是有一些不同的RGB值，背景也总是不同。我试图增加inRange()方法捕获的像素数，但是得到了更多的连接字符。在减少捕获像素的数量后，一些字母变得几乎不可见，而且Tesseract无法读取它们。请告诉我如何在二值化的图像上用白色分割这些字符。或

浏览 5提问于2022-04-15得票数 0

2回答

面向此识别案例的OCR软件推荐

computer-vision、ocr、tesseract

我必须像这样识别图片中的文本：我尝试过Tesseract，但我对结果不是很满意。你能给我推荐一款在“图像上的文本识别”方面比“文档上的文本识别”更准确的软件吗？提前感谢

浏览 2提问于2019-06-28得票数 0

1回答

如何使用tesseract和opencv从摄像机中提取文本？

opencv、ocr、tesseract

我使用tesseract 3.02和opencv来让tesseract实时识别相机中的文本。但效果相当糟糕。结果是不可读的，不能流畅地显示图像。我觉得这是我代码的问题。有人能给我关于如何修改它的建议吗？非常感谢! #include "stdafx.h" #include <string> #include <opencv2/opencv.hpp> #include <time.h> using namespace std; using namespace cv; int main() { // [1] tess

浏览 2提问于2012-12-26得票数 0

2回答

我怎样才能让Tesseract OCR识别电能表的大位数字？

ocr、tesseract

我想使用RPi上的OCR程序来识别我的电表照片中的数字。这些数字很大，对我来说很明显，但Tesseract似乎根本认不出它们--充其量它能检测到一些随机错误的数字。我已经尝试过剪切这些数字，并分别对它们进行OCRing，但这并没有帮助。我试过其他几个OCR程序，它们也没有更好。请你给我一些建议，我怎样才能让Tesseract正确地识别出下图中的两个大数字？请注意，这是原始图片是~2.5MB -这个副本更小，以适应这个网站。 📷

浏览 0提问于2017-08-07得票数 0

1回答

用模糊文本改进Tesseract OCR结果

image-processing、ocr、tesseract、motion-blur

我正在致力于印刷文本的OCR识别。特别是，我着重于预处理步骤，以改进引擎的结果。通过自适应阈值处理、噪声去除、文本分割等，取得了良好的效果。但是，当其他商业产品获得不错的结果时，Tesseract似乎还是失败了。我使用了下面的测试映像，下面是与两个商业OCR相比，Tesseract 3.04获得的结果。所有3项服务都提供了相同的二值图像，其中包含了一些稍微模糊的文本。 Tesseract Careers in Technology Consulting Networking Lunch 21 m 2014, 11:00 - 14:30 Definingthecorporatel

浏览 3提问于2014-12-27得票数 16

1回答

带气量计的电阻式OCR

android、image-processing、tesseract

我正试图让Tesseract从一张气表单元的照片中识别数字。但它主要返回空页作为输出(例如，我使用Tesseract 3.02)。我想把Tesseract用于Android的OCR应用程序，所以我只是想看看Tesseract是否能够识别这样的数字。第一张照片是我在java程序中通过图像预处理所能得到的。如果我使用gimp并手动进行更多的调整，tesseract将识别它。但是我需要它来识别像1这样的图片。有什么我可以做的吗？->。

浏览 3提问于2013-05-03得票数 2

2回答

Tesseract伪空间识别

c++、opencv、ocr、tesseract、spaces

我用tesseract来识别序列号。这是可以接受的，常见的问题，如零和"O"，6和5的错误识别，或者M和H的存在。此外，通过这个tesseract添加空格到可识别的词，其中没有空格在图像中。以下图像被识别为"HI 3H"。此图像产生“FBKHJ1R1” 所以tesseract添加了一个空格，尽管图像中没有真正的空格。是否有可能参数化的间距行为？编辑对不起，我忘了加一句，我也有包括空格的序列号。所以我不能删除识别序列号中的所有空格。例如，下面的图像包含序列号中的一个空格，在tesseract识别为：J4 F1583BB之后产生结果。此外

浏览 9提问于2015-06-26得票数 8

1回答

使用tesseract进行困难的文本识别

ruby-on-rails、ruby、image-processing、crop、tesseract

某些文本图像不能被tesseract识别。 FOr示例考虑以下未被tesseract识别的rails图像当使用OCRed时，上面的图像没有输出。而且有些图像的准确率达不到标准。我正在使用ruby on rails，为了实现tesseract OCR文本识别，我使用了'gem tesseract‘和一些代码。问题出在哪里?我怎样才能得到准确的输出？

浏览 4提问于2012-12-11得票数 1

4回答

tesseract不能识别一个数字图像

tesseract

我正在对python使用tesseract。它几乎可以识别我的所有带有2个或更多数字或字符的图像。但是tesseract不能识别只有一个数字的图像。我尝试使用命令行，但得到的响应是“空页面”。我不想用“只有数字”来训练tesseract，因为我也在识别字符。有什么问题吗？在未被tesseract识别的图像下面。代码： #getPng(pathImg, '3') -> creates the path to the figure. pytesseract.image_to_string( Image.open(getPng(pathImg, '

浏览 33提问于2018-03-27得票数 5

1回答

OCR。用tesseract识别里程计

android、ios、ocr、tesseract

我想从里程表中辨认出数字。我为iOS找到了这个教程。我的属性： func performImageRecognition(image: UIImage) { let tesseract = G8Tesseract() tesseract.language = "eng" tesseract.engineMode = .TesseractCubeCombined tesseract.pageSegmentationMode = .Auto tesseract.maximumRecognitionTime = 60.0 tesse

浏览 2提问于2016-04-17得票数 2

回答已采纳

1回答

是否能够识别使用Tesseract OCR绘制在iPhone屏幕上的字符？

ios、iphone、objective-c、ocr

从过去的两周开始，我正在努力实现“识别iPhone屏幕上的字符”。我搜索了这个，找到了Tesseract OCR。通过使用Tesseract OCR，我们可以从图片中识别字符。现在我的问题是，是否能够识别使用Tesseract OCR绘制在iPhone屏幕上的字符？如果可能的话，给我一些初步的步骤来完成这个任务。

浏览 2提问于2013-12-19得票数 6

回答已采纳

1回答

警告:图像没有大小！

ios、objective-c、uiimage、ocr、tesseract

你好，我正在尝试使用Tesseract OCR (iOS)，但是每当我从已拍摄的照片中选择图像或从本地照片中选择图像时，我都会得到以下信息：警告:图像没有大小！在尝试识别之前请打电话给SetImage。2014-06-14 20:44:07.613做Math431:60b内部计算请在尝试识别之前打电话给SetImage。2014-06-1420:44:07.614做Math431:60b没有识别的文本。检查-Tesseract setImage:是否传递了大于0x0的图像。我的方法“计算”如下： - (void)calculate { Tesseract* tesseract

浏览 3提问于2014-06-15得票数 0

回答已采纳

1回答

如何帮助Tesseract识别这个简单图像中的字符？

ocr、tesseract

这是我想要处理的原始图像的链接：在我使用opencv2处理图像后，我得到了以下结果：但即使有了上面的图像，Tesseract也无法识别图像中的字符。这发生在许多与上面的示例具有相同样式的图像中。任何关于如何提高图像质量或使用Tesseract的其他模式的建议都将是最受欢迎的。另外，如果上面的技术不起作用，请建议一种替代方案，例如训练Tesseract或使用其他OCR或方法？谢谢编辑:我也包括了代码 # Read the image im = cv2.imread("image.jpg") # Convert to

浏览 3提问于2016-06-26得票数 1

1回答

Tesseract OCR -将复选框识别为word

ocr、tesseract

对于一个客户，我想教Tesseract识别复选框作为一个词。当Tesseract应该识别一个空复选框时，它工作得很好。该命令与教程相结合，工作起来很有魅力，而且Tesseract能够找到空复选框并将其解释为"_"： tesseract -psm 10 deu2.unchecked1.exp0.JPG deu2.unchecked1.exp0.box nobatch box.train 下面是我成功分析文档的命令： tesseract test.png test -l deu1+deu2 然后，我尝试训练一个复选框，但得到了以下错误： Tesseract Open Source

浏览 24提问于2016-07-21得票数 5

回答已采纳

2回答

如何避免Tesseract将小行识别为数字或字母？

ocr、tesseract

我正在使用Tesseract来识别1bpp图像中的大而清晰的文本。它非常适合我选择的字体和字号。但是，它也将一些小线条和斑点识别为字母/数字。在附加的图像中，Tesseract不仅识别"Ge“、"1”、"2“、”j“和"Sp"，而且还识别每一行的附加"1"，对应于您在那里可以看到的那些小垂直线。如何避免Tesseract这样做？提前谢谢。

浏览 5提问于2014-11-29得票数 1

10回答

当数字和字母混在一起时，如何让tesseract只识别数字？

ocr、tesseract

我想使用tesseract来只识别数字。问题是我有数字和字母的混合，当我使用SetVariable("tessedit_char_whitelist", "0123456789")时对于每个符号，tesseract返回错误的数字。我可以设置一个阈值，让tesseract忽略相似度低的符号吗？注意:我将tesseract设置为只识别数字，这样就不会混淆O和0。

浏览 22提问于2011-02-09得票数 67

1回答

如何将tesseract配置更改为识别§并在R中应用pdftools::pdf_ocr_text？

r、ocr、tesseract、pdftools

我在R中使用pdftools从扫描和基于文本的PDF文件中提取文本。一个问题是§字符。这是不能被识别的。我查看了以下链接：我尝试了以下几点：我使用tesseract_info()找到了配置文件，并在configs下编辑了digits文件。digits文件内容如下： tessedit_char_whitelist 0123456789. 编辑后如下所示： tessedit_char_whitelist 0123456789-$§. 这并没有改变任何事情，我仍然无法提取§。它们仍然以8的形式出现。第一步失败后，我尝试了以下步骤：文件<- pdftools::pd

浏览 10提问于2020-12-01得票数 2

回答已采纳

1回答

如何告诉tesseract不要忽略单词之间的空格？

ios、ocr、tesseract

我正在尝试实现名片扫描应用程序。我用的是库。我读过与提高Tesseract性能有关的文章，在将图像传递给Tesseract之前，我很少通过预处理来尝试。我发现Tesseract对灰度/黑白图像效果最好。我很难选择正确的页面分割。到目前为止, G8PageSegmentationModeSingleBlock (假设一个单一的统一文本块) 给我最好的名片格式的结果。下面是使用这种分割模式的结果： GrayScale: 当使用灰度图像时，Tesseract识别单词(看看红色的矩形)，但有时它会识别单词之间的空格。这是输出： o f l ,t!ti,iy,,,tyii,

浏览 1提问于2018-02-13得票数 3

1回答

如何填补7段字符中每个段之间的空白

android、ios、image-processing、ocr、tesseract

我想要通过使用tesseract库的移动识别数字从里程计中识别数字。源图像：下一步：现在我需要填补每个部分之间的空白。你能帮我吗，我是怎么做的？(英语培训数据比更适合我) image processing: func prepareImage(sourceImage: UIImage) -> UIImage { let avgLuminanceThresholdFilter = GPUImageAverageLuminanceThresholdFilter() avgLuminanceThresholdFilter.thresholdMulti

浏览 7提问于2016-04-19得票数 2

回答已采纳

1回答

在给Tesseract之前，如何在图像中拼凑虚线？

python、opencv、image-processing、tesseract、text-recognition

我有一些数字值组成的屏幕图像。我想用Tesseract 4.0识别这些数字。然而，这些数字由虚线组成，如七段显示的线条.由于破折号，Tesseract无法识别这些值。我用吉普把那些虚线连成了一块。Tesseract几乎正确地识别了价值。我想用OpenCV做这件事。我怎样才能把虚线的数字连成一块呢？

浏览 1提问于2020-05-19得票数 0

回答已采纳

2回答

在python中使用tesseract 4

python、python-3.x、ocr、tesseract

我已经在python和pytesseract(来自Pypi)中使用了tesseract 3.04，现在我想使用基于4.00.00alpha的新LSTM 我使用的是kali linux，所以我安装了libtesserct4(使用apt-get)，它在tesseract-ocr中创建了名为4.00的文件夹，但当我尝试将它与pytesseract一起使用时，它无法识别--eom input 代码是： pytesseract.image_to_string(Image.open(filename),lang="en",config='--eom 2') 结果： read

浏览 2提问于2017-12-26得票数 2

1回答

如何通过tesseract OCR识别带有小数学符号的文本？

ocr、tesseract、image-recognition

我的文本中有一些不那么复杂的数学符号，如下所示。 Tesseract OCR default无法识别此类数学符号(+-，角度)。我如何通过tesseract识别这样的数学符号？

浏览 2提问于2017-09-27得票数 6

1回答

使用Tesseract检测黑色背景上的白色字符

tesseract

我对Tesseract OCR完全陌生。这个问题可能很简单，但我似乎无法用谷歌找到答案。基本上，我有一个包含两部分的图像:第一部分，在图像的顶部，具有黑色背景，文本为白色；第二部分，位于图像的底部，具有白色背景，文本为黑色。我在图像上运行了tesseract，它正确地识别了底部的所有字符，但没有识别顶部的字符。我确信顶部的字符非常清晰，应该很容易被Tesseract识别。唯一的区别是它的背景是黑色的。有没有办法使用Tesseract同时识别黑白背景下的文本？

浏览 48提问于2016-08-18得票数 11

回答已采纳

1回答

如何训练只识别20到30位数字？

android、ocr、tesseract

在我的项目中，我正在使用 Tesseract Android工具。从我所做的研究中，我从找到了一种限制字符类型的方法，而不是字符的范围。我使用的Tess-2库没有tessdata/config文件，那么如何限制tesseract识别的可能字符呢？我如何限制Tesseract识别范围内的数字(20到30)？

浏览 3提问于2015-04-29得票数 4

1回答

Tesseract无法识别一系列随机的英语字符。

ocr、tesseract

我正在寻找一些帮助来配置Tesseract来识别以下图像(称为token.png)中的字符：使用默认设置运行Tesseract tesseract token.png output 结果： lidad3dbecsc2dedeeaedsd72bbest4 bsddo60cdetsdic? 在上，建议禁用字典如果大多数文本不是字典词，禁用Tesseract使用的字典应该会提高识别率。可以通过将配置变量load_system_dawg和load_freq_dawg设置为false来禁用它们。然而，这并没有帮助。例如，将文本文件config构造为 load_system_daw

浏览 0提问于2019-07-25得票数 0

1回答

从图片python中识别明文

python、nlp、ocr、python-tesseract

我用pytesseract从图像中识别文本 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 然后我使用下面的代码来识别文本 textImg = pytesseract.image_to_string(Image.open(imgLoc+"/"+imgName)) print(textImg) text_file = open(imgLoc+"/"+"oriText.txt", "w")

浏览 2提问于2019-05-25得票数 0

2回答

在windows中，tesseract命令不能从命令行执行

python、tesseract、python-tesseract

我安装了windows的tesseract-OCR，它位于我系统的C:\Program Files\Tesseract-OCR路径中。我通过在PATH变量中添加C:\Program Files\Tesseract-OCR来设置环境变量。我还将系统变量中的TESSDATA_PREFIX设置为上面相同的tesseract位置。尽管如此，当我尝试运行命令"tesseract some path\image.tif somepath\output“时，它给出的消息是"'tesseract‘未被识别为内部或外部命令”。当我从tesseract的安装位置运行相同的命令时，它

浏览 1提问于2017-08-20得票数 1

2回答

iOS .Tesseract OCR为什么识别如此纯粹。发动机原理

ios、ocr、tesseract

我有一个关于Tesseract OCR原理的问题。据我所知，在形状检测之后，符号(它们的形式)被缩放(调整大小)以具有特定的字体大小。这样的字体大小是基于训练数据的。基本上，训练集定义了符号(它们的几何形状，形状)，也许是它们的表示。我使用的是iOS平台上的Tesseract 3.01 (最新版本)。我检查了Tesseract常见问题，看了论坛，但我不明白为什么一些图像我有低质量的识别。据说字体应该大于12pt &图像应该有超过300DPI。我做了所有必要的预处理，如模糊(如果需要)，对比度增强。我甚至在Tesseract OCR中使用了其他引擎-它被称为CUBE。但对于一些图像

浏览 19提问于2013-11-21得票数 2

1回答

OpenCV tesseract未检测到图像中单个数字

python、ocr、tesseract

我正在对python使用tesseract。它能识别几乎所有包含2个或2个以上数字或字符的图像我不想用“只有数字”来训练tesseract，因为我也在识别字符。但是附加的图像不能从tessearact中识别

浏览 33提问于2020-06-01得票数 0

1回答

Tesseract命令行界面:获得每个字符的识别可信度

tesseract

当使用Tesseract C API时，可以迭代识别的字符，获得它们的边界框和它们的识别可信度。我已经了解了如何使用Tesseract CLI获取边界框，它是通过在命令末尾添加makebox来完成的。问题是它不包含认可的信心。有没有办法告诉Tesseract CLI也输出每个字符的信心？

浏览 6提问于2017-06-20得票数 1

1回答

Tesseract iPhone :如何识别字符数？

ios、iphone、xcode、tesseract

我正在尝试构建一个新的应用程序，正在使用tesseract。我有个问题需要你的帮助。有没有办法让tesseract识别图像中有多少个字符，然后将每个字符保存到一个变量中？在我的应用程序中，tesseract识别文本并将其存储到label.text中。

浏览 1提问于2014-02-01得票数 0

1回答

NameError:未定义名称“”pytesseract“”

python-3.x、path、tesseract、python-tesseract、pytesser

无法识别Pytesseract。我已经尝试了在线文档中记录的所有修复，包括将tesseract OCR添加到我的Path变量中，将pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'命令路径整合到我的脚本中，卸载并重新安装pytesseract和tesseract。

浏览 67提问于2020-03-06得票数 2

1回答

在pushViewController之后没有出现ViewController

ios、objective-c、uiviewcontroller、tesseract

我已经开始了一个包含使用Tesseract的字符识别的项目！我想在字符识别之后打开一个新的viewController (EditViewController)，但无论我尝试了什么，都失败了。下面是我的代码： -(void)recognizeImageWithTesseract:(UIImage *)image{ GPUImageAdaptiveThresholdFilter *stillImageFilter = [[GPUImageAdaptiveThresholdFilter alloc] init]; stillImageFilter.blurRadiusInPix

浏览 0提问于2015-02-12得票数 0

1回答

使用R中的tesseract识别图像中的特定字符？

r、image、image-processing、ocr、tesseract

我试图识别和删除心电图图像文件中的特定字符。在ECG中，出现的“单词”不是通常的英语单词，而是像"aVR“、"V5”、"II“这样的引号。下面是一个示例图像：我试图使用R中的tesseract包来识别和删除这些图像中的所有字符/数字，以便只留下心电图线。这就是我尝试过的： eng <- tesseract("eng") ECG_signs1 <- tesseract(options = list(tessedit_char_whitelist = "V1V2V3V4V5V6aVRaVLaVF")) ECG_sign

浏览 3提问于2022-10-07得票数 1

1回答

Tesseract OCR查找的方框太少/忽略小字符

ocr、tesseract

我对Tesseract的训练/文本识别过程有问题。这是我的训练数据：在训练Tesseract时会忽略破折号(我用红色的方框标出了它们，只是为了清楚我指的是哪些)，如果我使用训练过的数据进行文本识别，它也会忽略它们。今天，我尝试了一下Tesseract参数(SetVariable(name，value))，但不幸的是没有成功。我能做些什么来教Tesseract这些破折号？提前谢谢你！

浏览 2提问于2015-04-01得票数 0

2回答

为OCR设置Tesseract字体

fonts、ocr、tesseract

我想使用tesseract来识别序列号，我只想识别单个字符，没有单词，没有字典。因此，我想使用一种已经训练过的tesseract字体类型作为序列号，以获得更好的识别结果。这些是训练有素的Tesseract字体类型： Andale_Mono.ttf Arial_Black.ttf Arial_Bold.ttf Arial.ttf Comic_Sans_MS_Bold.ttf Comic_Sans_MS.ttf Courier_New_Bold.ttf Courier_New.ttf Georgia_Bold.ttf Georgia.ttf Gottf Impact.ttf Times_New_

浏览 8提问于2015-07-14得票数 45

1回答

Tesseract OCR无法识别从设备拍摄的图像

ios、ocr、tesseract

我正在使用开发一个可以检测名片上的文本的应用程序。我被困在让Tesseract检测图像中的文本。如果我通过代码传递图像，Tesseract就能够检测到它。如果我提供从相机拍摄的图像，tesseract无法识别它。 -(void)startTess:(UIImage *)img{ G8Tesseract *tesseract = [[G8Tesseract alloc] initWithLanguage:@"eng"]; tesseract.delegate = self; tesseract.engineMode=G8OCREngineModeTesseractCu

浏览 3提问于2017-12-23得票数 2

1回答

android系统中Tesseract最大识别时间

android、tesseract、tess-two、text-recognition

我对android中的tesseract识别时间有问题，要识别文本需要花费太多的时间。在ios中，它有一个函数，可以给出像tesseract.maximumRecognitionTime = 60.0一样的最大识别时间。在安卓系统中，像ios一样，有什么办法给出最大的识别时间吗？(我使用的是tess二库)

浏览 3提问于2016-02-19得票数 1

回答已采纳

1回答

为什么这个图像上的英语单词不能识别？

tesseract、python-tesseract

我使用tesseract 4.0来识别英语单词，但是在这个图像上失败只识别，没有任何单词被识别，任何人都可以给小费，谢谢 r=pytesseract.image_to_string('6.jpg', lang='eng') print(r) 更新：我试着用在线网站进行OCR。而且很管用，但为什么？我怎么才能用tesseract来识别它呢？

浏览 5提问于2020-12-25得票数 0

2回答

在xcode中，如何使用Tesseract OCR逐帧实时扫描相机预览

ios、camera、real-time、ocr、tesseract

正如你们许多人所知，Tesseract在静态照片或图像中进行字符识别。我在我的iOS应用程序中使用xcode，但我遇到了这个问题。如何使用tesseract扫描摄像机实时预览。Word Lens应用程序就是这样做的，它可以对相机预览的文本进行逐帧实时识别和翻译。我试着在没有翻译部分的情况下进行实时字符识别。最好的方法是什么？如何使用Tesseract OCR逐帧实时扫描相机预览？谢谢。

浏览 1提问于2012-11-21得票数 1

2回答

tesseract虚假置信决策

c++、ocr、tesseract

我正在使用tesseract来识别序列号。在tesseract，有可能在不同的层次上识别文本，比如识别单个单词、行、段落、字符。也有可能获得这些水平的每个方面的信心。因此，我查看了我的序列号中每个字符的可信度，并注意到tesseract通常返回的是最好的选择，而不是最自信的字符。有人也经历过这种情况吗？我在识别方面做错了什么吗？例如，对于这样的位置，正确的序列号应该是：OC2VRHT5查看最后一个字符。虽然"5“有较高的可信度，但tesseract将"S”作为最佳选择。 **Tesseract output:** symbol O, conf: 88.679855 - O

浏览 3提问于2015-06-27得票数 2

1回答

如何配置tesseract来识别这个数字？

tesseract、digits

我想让tesseract识别附加图像上的数字： ? 当数字以7开头时，Tesseract能够识别，但一旦有8，它就会失败。我使用的是这样的东西： tesseract image.png output --oem 3 --psm 11 -c tessedit_char_whitelist=0123456789 我循环了oem和psm (1..20)的所有选项，但没有一个是好的。我是不是遗漏了什么让它工作的东西？

浏览 40提问于2021-09-26得票数 0

1回答

Tesseract不能识别简单的数字

ocr、tesseract

$ tesseract pin3.png output $ cat output.txt bon 9 no Us (oe // expect 391 205 786 4 我认为图像并不复杂，但tesseract无法识别图像的数量。我想也许数字的颜色是白色的，所以我试着把数字的颜色改成黑色，但结果是一样的。如何才能让tesseract识别这种类型的图像呢？谢谢 --如您所见，这不是一个单词

浏览 382提问于2019-03-13得票数 0

回答已采纳

1回答

tesseract不能读清楚一行

tesseract

所以我在这里看到了这张png图像当我试图在命令行上用tesseract读取它时，我会得到一些随机字符。 ❯ tesseract Selection_002.png stdout --psm 7 Warning. Invalid resolution 0 dpi. Using 70 instead. ale PR Me) 我正在ubuntu上运行tesseract版本4.0.0-beta.1-370-g8b64。我会猜到这张图片很容易读懂吗？我已经尝试过调整图像的大小，并“清理”它，但没有太多的噪音来清理。我做错什么了？

浏览 0提问于2018-06-15得票数 0

回答已采纳

1回答