识别准确率高的ocr_ocr准确率高的软件_ocr识别准确率 - 腾讯云开发者社区

python、ocr、tesseract、python-tesseract、pdf-extraction

我一直在尝试从扫描的pdf文档中提取数据。我已经将pdf文件转换为jpeg文件(我在下面附上了图像链接)，裁剪具有不同字体的单词和数字，合并为tiff文件，并使用jTessBoxEditor训练字体生成新的语言，我使用该语言在Tesseract-OCR中提取文件中的数据。但我无法提取准确的数据。tesseract-ocr的文本识别准确率很低。有没有人能提出一个提高准确率的方法？

浏览 21提问于2020-08-31得票数 1

2回答

如何OCR电子邮件地址

c#、image-processing、ocr、tesseract、emgucv

我正在尝试OCR和提取图像中的电子邮件。图像应该有一行文本，即电子邮件地址。我使用EmguCV.OCR从这些图像中提取文本(电子邮件地址)。我们的目标是获得100%准确的结果。我们可以固定文本的字体和大小。例如Ariel，12pt，这样所有的图像都会有用Ariel 12pt写的电子邮件，在白色背景上是黑色的。问题是EmguCV中的Tesseract OCR不能正确识别文本。它只能正确识别80%的字符。我正在使用Leptonica库进行预处理。以下是我正在尝试识别的一些示例图像。有没有办法达到100%准确率的目标？

浏览 0提问于2014-10-30得票数 1

1回答

使用tesseract进行困难的文本识别

ruby-on-rails、ruby、image-processing、crop、tesseract

某些文本图像不能被tesseract识别。 FOr示例考虑以下未被tesseract识别的rails图像当使用OCRed时，上面的图像没有输出。而且有些图像的准确率达不到标准。我正在使用ruby on rails，为了实现tesseract OCR文本识别，我使用了'gem tesseract‘和一些代码。问题出在哪里?我怎样才能得到准确的输出？

浏览 4提问于2012-12-11得票数 1

1回答

如何在tess4j中关闭词典？

java、ocr、tesseract、tess4j

在我的tess4j OCR应用程序中，字符识别的准确率很低。我听说，关闭tess4j中的字典将提高准确性，让个人字符被识别。但我不知道该怎么做。有人知道如何关掉tess4j中的字典吗？

浏览 12提问于2014-10-20得票数 0

2回答

提高屏幕截图上的Tesseract OCR准确率

image-processing、ocr、tesseract、training-data

截图上的tesseract OCR给出了相当不稳定的结果。即使图像完全是黑色的，上面覆盖着白色文本，似乎也只有部分文本被正确识别。即使在我将图像调整为300dpi之后，准确率仍然很低，并且大多数文本都是胡言乱语。我在StackOverflow上看到了类似的问题：Best way to recognize characters in screenshot? 如前所述，问题的作者能够通过用他的字体训练tesseract引擎来获得几乎100%的准确率。我的图像中的字体是Arial。我怎样才能提高准确率呢？这是我拥有的一种图片的示例：Image Sample

浏览 33提问于2019-06-19得票数 0

1回答

提高安卓TessBaseAPI (Tesseract)字符识别准确率

android、ocr、tesseract

在以下的帮助下，我在我的项目中使用了TessBaseAPI。但是，使用500万像素的摄像头，他们的结果是50%到60%。我想提高我的OCR的准确度。 VietOCR还使用tesseract进行光学字符识别；他们的结果令人惊叹，准确率超过90%。但是我的应用程序的准确性不是很好。

浏览 1提问于2012-07-20得票数 3

3回答

关于OCR 运单识别方案疑问？

文字识别

想利用OCR中的运单识别方案运用在教育层面，如果图片并非运单样式，而只是普通纸张的手写图片是否可识别，包括中英文、数字、符号。

浏览 475提问于2018-03-01

2回答

对OCR图像进行倾斜和过滤

android、ocr、tesseract

我做了很多研究，还没有找到一个合适的解决方案。我正在编写一个Android OCR应用程序。我已经成功地加载了Tesseract和Leptonica，我正在成功地拍摄和处理图像，以及使用OCR将它们转换为文本。然而，识别准确率并不是很好。经过多次调整后，我们发现我们没有对图像进行足够的过滤、清洗和/或去偏斜来帮助Tesseract进行OCR处理。因此，我在互联网上寻找任何适合我的库或代码，并在Android上使用它，但无济于事。有没有人知道一个库，或者可以提供一些代码来帮助我完成这项工作？我想要的就是将位图转换成黑白，去偏斜和/或执行一些过滤任务，并将其提供给Tesseract，以便使用O

浏览 2提问于2012-08-25得票数 3

回答已采纳

3回答

人工神经网络对油漆图像的识别失败

machine-learning、artificial-intelligence、mnist

我用MNIST数据集(有50000个训练输入)训练了我的ANN，然后跑了起来。当我尝试MNIST dataset.But中包含的测试输入时，我得到了91-92%的准确率(这是很高的)如果我给我的绘画图像作为我训练的人工神经网络的输入，它无法识别数字。即使是最清晰的。然而，如果我从互联网上下载一个数字的图像，它识别的准确率很高。所以，我不明白为什么我的ANN So除了画图之外什么都能识别。(MNIST数据集包含在黑色背景上具有白色数字的图像。)

浏览 2提问于2018-07-09得票数 0

1回答

如何在OCR扫描的代码中添加冗余

algorithm、ocr

这更多的是一个算法问题-我不是很数学，所以我在寻找一个工程解决方案……如果这是离题的，让我知道，我会删除问题。我创建了一个开源的goodness混搭，用于在困难的背景上进行光学字符识别：我想用它来扫描带有预定义ID代码的标签，例如2826672。对于数字，准确率约为70%。问:如何以编程方式向代码添加冗余以将准确率提高到99%，以及如何对其进行解码？我可以想象一些非常笨拙的方法，比如数字翻倍和倒置，但我不知道如何在不翻译大量数学的情况下，以一种尊重信息论的方式做到这一点。如何添加和解码数字以纠正OCR错误？

浏览 1提问于2015-02-04得票数 4

1回答

谷歌视觉十六进制数字识别

c#、google-cloud-vision

Google能够识别经常出错的十六进制数字(准确率约为60%)。例如，当我试图识别带有“78303D 61”的扫描图像时，Google会识别它的文本，比如“78303061”。对于OCR识别，我使用了和.NET Api客户端，结果也不正确。以下是我的C#代码： var image = await Google.Cloud.Vision.V1.Image.FromFileAsync("c:\\path\\to\\file.png"); var imageContext = new ImageContext(); imageContext.LanguageHints.Add(&#

浏览 3提问于2020-12-08得票数 0

1回答

有没有一种OCR可以将它看到的东西与我给它的可能单词列表进行比较？

ocr

我正在寻找一个开源的OCR，但我可以告诉程序我希望它寻找哪些字母。例如，如果只有字母和逗号是可能的，那么我不希望OCR浪费资源来判断它是否是数字。此外，我希望OCR输出它“认为”它所看到的可能性。例如，如果有一个'I'，那么OCR可能会认为它是一个小写的'L‘，但它也应该有一个紧随其后的'I’。基本上，我想让OCR给我一个可能性的列表，也许还有一个数字来表明它有多确定。例如，它可能会说'l'：55%，'I':40%，其他: 5%。另一件事是我将知道字母的文本类型，即Ariel，因此没有意义的OCR比较和对比不同类型的文本。基本

浏览 0提问于2012-07-16得票数 1

1回答

计算的哪个分支涉及到图像中的目标识别？

recognition、image

它的几个应用是文本识别(OCR)、人脸识别(生物特征识别)、相机制导导弹(目标获取系统)。每一个都涉及到分析图像和制作一些感兴趣的对象。是否有一个术语来描述程序的这个分支？

浏览 0提问于2012-09-21得票数 2

回答已采纳

3回答

专门为渲染文本设计开源OCR引擎(屏幕截图)

python、screen-scraping、ocr

因此，我目前的个人项目是能够自动从游戏中抓取屏幕截图，对文本进行OCR，并计算给定单词的出现次数。整个晚上我都在研究不同的OCR解决方案，我意识到大多数OCR包都是为扫描文本而设计的。如果有任何软件包可以可靠地阅读屏幕文本，那么它们远远超出了这个爱好者的预算。我一直在浏览其他一些问题，我找到的最接近的问题是。在我看来，阅读渲染文本应该比打印和扫描文本容易得多。线条始终是直的，任何给定的字母都将始终以完全相同的像素表示形式出现(大多数情况下，不管怎样)。另外，为什么不使用实际的字体文件(如果你有)作为识别字符的小抄呢？使用这样的系统，我们可能会达到100%的准确率。假设你有一个小抄的字体

浏览 0提问于2010-12-27得票数 3

回答已采纳

1回答

通过字段识别和光学字符识别(OCR)实现数据录入自动化，用于预定义表单上的手写

forms、opencv、computer-vision、ocr、tesseract

我希望从已经手动填写的预定义表单中自动输入数据。字符不是分开的，但是字段可以通过下面的行或作为表的一部分来标识。我知道手写OCR仍然是一个活跃的研究领域，我可以包括操作员审查功能，所以我不希望准确率超过90%。我想到的第一个解决方案是将用于字段标识的OpenCV ()和用于识别手写内容的Tesseract ()相结合。另一种可能更简单和更有效的方法是使用预定义表单进行字段标识，方法是以某种方式从填充的表单中减去空白表单。由于表单将被扫描，这可能需要一些位置容差、降噪和特征识别。如有任何建议或意见，我们将不胜感激。

浏览 18提问于2017-12-29得票数 0

1回答

提高扫描文档的OCR精度

image-processing、ocr、image-scanner、text-recognition

我正在使用标准的兄弟A3多功能扫描许多A3文档，然后使用FineReader Pro对图像进行OCR‘。然而，我得到了很多错误的字符识别，和许多非字母数字奇怪的字符。有人能给我任何建议，以编程方式提高OCR的准确性，要么对扫描图像进行预处理，要么对识别的文本进行后处理？编辑：.它包括一些样本图像，从中我得到了最糟糕的结果。

浏览 3提问于2011-01-11得票数 1

回答已采纳

5回答

识别截图中字符的最好方法？

fonts、ocr、tesseract、pattern-recognition

你有什么建议来识别截图中的所有字符？屏幕截图非常清晰(只有白色背景上的黑色文本)，我还可以选择任何标准字体的文本(安装在Windows上)。我尝试了一些OCR方法(Tesseract等)，但它在识别一些字符时出现了错误(这让我感到困惑，因为文本没有丝毫噪音，字体是一些最常见的字体- Courier New，Fixedsys等)，我需要它是100%准确的。有没有一些库可以用于这个特定的目的，比如模式识别之类的？或者我应该获取带有等宽字体的屏幕截图，然后遍历图像，移动到正确的+font_size像素，然后将捕获的内容与相同大小的相同字体的字母和数字的内存表示进行比较？解决这个问题的最佳方法是什么？

浏览 0提问于2010-11-18得票数 23

1回答

在期刊文章中报告了哪种准确性(训练或测试)？

machine-learning、prediction

我是第一次接触神经网络。当我阅读文章时，他们经常说“我们注意到98%的准确率”。我仔细阅读了这些文章(参见下面的两篇文章)，但没有进一步的信息表明准确性是指训练还是测试(验证)。请让我知道作者所暗示的准确性。 Grinblat，G. L.，尤扎尔，L. C.，Larese，M.G.，& Granitto，P.M. (2016)。利用叶脉形态模式进行植物识别的深度学习。农业中的计算机和电子技术，127,418-424。 Satti，V.，Satya，A.，& Sharma，S. (2013)。基于机器视觉技术的植物叶片自动识别系统。国际工程科学与技术杂志，5(4)，874。

浏览 31提问于2019-09-09得票数 0

1回答

Tesseract-OCR:需要训练所有类型的样本吗？

ocr、tesseract

我想做一个应用程序，可以将打印的名片转换为文本。我了解到tesseract-ocr可以通过训练提高准确性。如果我希望每种类型的名片都有很高的准确率，我需要训练所有类型的名片吗？有数百种类型的名片具有不同的字体或格式。有没有其他方法可以在tesseract-ocr中达到高精度？

浏览 23提问于2016-01-22得票数 0

2回答

适用于Iphone应用的OCR

iphone、objective-c、opencv、ocr

我是个初学者。我想实现应用程序的名片阅读器(光学字符识别)，我几乎没有OpenCV的知识。我想知道我从哪里开始？任何链接或例子真的很感谢。我已经尝试过这个，但是在这个源代码中，准确性不是很好。所以我个人决定通过使用openCV来提高图像的质量，就像我将原始图像转换为灰度图像，然后转换为BLack和白色，但仍然输出不好。我必须提高图像中字符的质量，以便我的OCR阅读器可以轻松地读取字符，以获得最佳的准确性。我经常尝试达到最好的准确率，但仍然什么也得不到：感谢所有人

浏览 3提问于2012-11-07得票数 2

2回答

我怎样才能让Tesseract OCR识别电能表的大位数字？

ocr、tesseract

我想使用RPi上的OCR程序来识别我的电表照片中的数字。这些数字很大，对我来说很明显，但Tesseract似乎根本认不出它们--充其量它能检测到一些随机错误的数字。我已经尝试过剪切这些数字，并分别对它们进行OCRing，但这并没有帮助。我试过其他几个OCR程序，它们也没有更好。请你给我一些建议，我怎样才能让Tesseract正确地识别出下图中的两个大数字？请注意，这是原始图片是~2.5MB -这个副本更小，以适应这个网站。 📷

浏览 0提问于2017-08-07得票数 0

1回答

汽车相关的证件照图片，使用ORC接口识别准确率很低？

文字识别、腾讯云测试服务

汽车证件照图片，使用ORC接口识别，准确率很低，但是把图片放到你们平台的测试上面，准确率很高，也就是说我调用你们接口，识别不出来，但是我把图片放到你们网站中识别，一下子就识别出来了，是不是因为免费版本的问题？假如后期我付费了，准确率会提高吗？

浏览 222提问于2020-09-25

1回答

使用opencv的阈值图像(Java)

java、android、opencv、image-processing、tesseract

我正在为我的项目使用Opencv。我需要将下面的图像转换为阈值图像我尝试了这个函数： Imgproc.threshold(imgGray, imgThreshold, 0, 255, Imgproc.THRESH_BINARY + Imgproc.THRESH_OTSU); 但是结果并不是很好，如下所示所以我尝试了adaptiveThreshold function： Imgproc.adaptiveThreshold(imgGray, imgThreshold, 255, Imgproc.ADAPTIVE_THRESH_GAUSSIAN_C, Imgproc.THR

浏览 2提问于2015-07-08得票数 11

回答已采纳

1回答

为什么pytesseract无法识别此图像？

ocr、tesseract、python-tesseract

我正在尝试用tesseract来识别python中的单位数。我的代码是： import numpy as np from PIL import Image from PIL import ImageOps import pytesseract import cv2 def predict(imageArray): pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe" newImageArray = Image.open(imageArra

浏览 33提问于2020-03-01得票数 0

1回答

convnet的准确率突然下降

machine-learning、tensorflow、computer-vision

我试图使用这个中提出的体系结构在fer2013数据集上训练情感识别模型这篇论文使用的数据集与我的不同，所以我在步幅和过滤器大小上做了一些修改。经过几个小时的训练，训练和测试集的准确性都会突然下降。在那之后，两组的准确率都只保持在0.1-0.2左右，再也不会提高了。有没有人知道这种现象？

浏览 1提问于2017-12-04得票数 0

1回答

为什么pytesseract不识别个位数？

python、ocr、tesseract、python-tesseract

我正在一个网站上执行ocr，特别是在这两张图片上：我对OCR相当陌生，我使用以下方法： from PIL import Image import pytesseract my_image = '....png' text = pytesseract.image_to_string(Image.open(my_image)) 在第二张图像中，它识别除个位数3、4、5、6以外的所有东西。在第一个图像中，它也不识别个位数。我通过调整图像大小、反转图像和使用阈值对图像进行预处理。这是一种标准字体，所以我知道还有其他方法可以做到这一点，但在达到一定程度之前，它对

浏览 0提问于2014-09-28得票数 1

1回答

为什么我在McMahan的论文中创建了一个像FedAvg这样的非IID数据集，但这个数据集的测试精度只有0.5？

python、tensorflow、imbalanced-data、tensorflow-federated

我创建了一个非IID数据集，其中我将60000个示例(10个类，每个类有6,000个示例)划分为200个片段，每个片段有300个示例。有100个客户端，我为每个客户端随机分配2个片段。这是一些客户的情况。我使用这个数据集来训练我的TFF模型。训练集的准确率约为0.99，而测试集的准确率仅为0.5左右。我试了很多次，但都没反应。我认为可能模型是过拟合的，所以我添加了两个dropout进行测试，但我得到了相同的结果。然后我将relu()函数更改为leakyrelu()，并将优化器函数从SGD更改为Adam，但准确率也约为0.5。我不知道为什么。我知道非IID会导致准确率下降，而FedAvg可以缓

浏览 0提问于2020-04-15得票数 1

1回答

Vim运行所有以相同名称开头的文件类型插件

vim、ftplugin

刚刚发现，vim运行所有以相同名称开头的ftplugin。例如：检测到的文件类型= ocr 这些文件具有不同的版本。因此我有不同的ftplugins： ocr_01 =>基础版(检查文件版本并设置正确的文件类型)ocr_01 =>版本01...ocr_n =>版本n 当打开一个光学字符识别文件，文件类型被检测为‘光学字符识别’->的光学字符识别基础-File插件将加载。它检查文件的版本(例如01) =>文件类型将被设置为ocr_01。我期望，只有文件类型插件ocr_01加载，但所有以'ocr‘开头的ftplugin是: ocr_01，ocr_02..

浏览 8提问于2013-07-26得票数 0

0回答

调用OCR营业执照识别报内部错误？

html、文字识别

调用调用OCR营业执照识别报“内部错误”这种不明不白的提示，相同的header，相同的multipart/form-data 方式，调用“OCR-通用印刷体识别”确能识别成功，证明程序的加密方式，图片的base64没有问题！OCR营业执照识别确报“内部错误”看不明白什么意思。

浏览 271提问于2019-07-10

2回答

尽管输入了确切的语句，AWS Lex仍然匹配错误的意图。

amazon-web-services、artificial-intelligence、chatbot、amazon-lex

我在很多不同的情况下都有这个问题。我将分享一个例子。我有一些常见问题的意图。一个答案是“什么是命名实体识别”--这是它的话语：告诉我关于命名实体的识别告诉我关于纳的事什么是纳你所说的命名实体识别是什么意思？什么是命名实体识别另一个回答是“什么是光学字符识别？”这是它的话语： OCR 你说OCR是什么意思？你能告诉我什么是OCR吗？讲述OCR 什么是光学字符识别？什么是OCR？当我进入时，“ocr是什么？”它按照预期工作，并给出了OCR的答案。但是当我在所有大写中输入OCR时，都会问同样的问题(OCR是什么？)它

浏览 4提问于2019-03-22得票数 2

回答已采纳

1回答

平滑像素化二进制图像的边缘python代码

python、opencv、image-processing、ocr

我正在使用pytesseract将图像转换为文本，但是准确率并不是100%，因为图像在调整大小时会像素化。应用高斯模糊将平滑边缘，但模糊图像，使OCR无法检测文本。哪种类型的过滤器可以平滑边缘而不会使图像变得太模糊。图像如下所示图像 ?

浏览 18提问于2019-07-01得票数 3

8回答

OCR文字识别技术有哪些应用？

文字识别

OCR 是实时高效的定位与识别图片中的所有文字信息，返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别，以及中英文、字母、数字的识别。简单来说就是将图片上的文字内容，智能识别成为可编辑的文本，这么强大的功能在我们生活当中有哪些应用呢？

浏览 3534提问于2018-08-24

0回答

获得最佳识别结果的最佳Tess-two配置？

android、ocr、tesseract、tess-two

我目前正在开发一个android应用程序，它利用开源OCR库"Tesseract“来制作一个收据识别应用程序。我让这个库与Tesseract的"Tess-two“分支一起工作。我遇到的问题是，这种认识非常不一致。即使提供了正确裁剪的好图像，识别效果也不是很好。我要说的是，在我认为理想的情况下，识别准确率约为90%。当提供任何数量的次优条件时(暗淡的灯光、模糊的图像、未裁剪等)我发现我经常会得到几乎0%的准确率。对于我的应用程序来说，即使90%的准确率也是令人无法接受的，因为我需要能够“完美”地从收据中获得确切的信息和数字，而不需要担心不正确地读取信息。所以我的问题是:配置T

浏览 10提问于2016-06-30得票数 0

2回答

Tesseract: RetriveResultDetail-方法总是返回null

c#、.net、ocr、tesseract

我想用.Net中的Tesseract OCR引擎做一个光学字符识别。因此，我使用了tesseractdotnet-Wrapper 。我需要获取每个识别单词的单词位置(RetriveResultDetail-Method)： TesseractProcessor ocr = new TesseractProcessor(); ocr.Init(executionPath, "eng", 3); Image image = Image.FromFile(imagePath); Console.WriteLine(ocr.Apply(image)); List<tesserac

浏览 0提问于2013-06-03得票数 0

回答已采纳

1回答

如何在小图像中使用pytesseract提高手写文本的识别率？

python、image-processing、ocr、tesseract

我想使用pytesseract库进行手写文本识别，以读取平均维数为43 * 45像素的图像中的数字字符。以下示例图像：预期结果： 9 1 4 我想从图像中得到一个数字字符。我在下面尝试过这段代码 import pytesseract # loop through images print(pytesseract.image_to_string("text.jpg", config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')) 但真正的结果是，我得到的准确率不到50%，甚至更低

浏览 6提问于2020-06-26得票数 4

2回答

Windows ocr能识别自定义符号/字体吗？

c#、uwp、windows-phone、win-universal-app、ocr

我正在为UWP开发，Windows有一个OCR引擎: Windows.Media.Ocr 我的问题是:有人知道Windows OCR是否可以接受识别新字符或使用自定义字体的培训？如果是的话，我怎么能做到？我想要实现的是识别非字母符号。我想在每个例子中识别字符⌰(unicode: U+2316)或⌖(U+2316)。我想识别的字符不是任何语言的符号。

浏览 9提问于2016-03-07得票数 3

回答已采纳

1回答

是否能够识别使用Tesseract OCR绘制在iPhone屏幕上的字符？

ios、iphone、objective-c、ocr

从过去的两周开始，我正在努力实现“识别iPhone屏幕上的字符”。我搜索了这个，找到了Tesseract OCR。通过使用Tesseract OCR，我们可以从图片中识别字符。现在我的问题是，是否能够识别使用Tesseract OCR绘制在iPhone屏幕上的字符？如果可能的话，给我一些初步的步骤来完成这个任务。

浏览 2提问于2013-12-19得票数 6

回答已采纳

1回答

一种用于模因图像的OCR字体

algorithms、c

我正在为网络模因图像编码一个特殊的光学字符识别。这是一个学校项目，应该用C语言编码。目前，我在编写OCR代码的方法/算法上遇到了问题。事实上，几乎所有的模因图像都有相同的字体，这是影响(更不用说其他没有影响字体)。OCR的目标将是检测和识别字符，这些字符在影响字体，在模因图像的前景，而不是在它背后的场景。要做这个OCR，我的意思是神经网络有点过火，因为模因图像中的字符是简单的、直接的和向前的。我听说有其他“更简单”的方法来做OCR，比如使用机器学习算法来“学习”影响字体，或者使用基于骨架匹配的系统通过模式识别来识别字符。做OCR最好的方法是什么？而是神经网络？模式识别？机器学习？

浏览 0提问于2016-03-28得票数 1

回答已采纳

2回答

哪个光学字符识别引擎更好: Tesseract还是OCRopus？

ocr、tesseract、feature-extraction

我在iPhone上试用过Tesseract，在没有图像预处理的情况下，它的准确率达到了70%。我还注意到它在提取数字方面可能很差。我听说过Tesseract OCR引擎:在数字提取和图像预处理方面，OCRopus和OCRopus哪个更好？有没有人用两个引擎运行测试，用通常的指标比较结果？

浏览 1提问于2012-04-06得票数 32

回答已采纳

1回答

sphinx识别字母表的准确率非常低

cmusphinx、alphabet

我正在使用CMU sphinx来识别字母表，但我注意到准确率非常低。( <=20%)。例如:当我拼写字母: A-P-P-L-E时，结果是A、B、B、L、E。准确率太低，没有用。我希望不要像一些帖子提到的那样实现它，使用"alpha""beta“等来提高识别率。在中生成字典文件和lm文件:当我限制字典并用词对话筒说话时，准确率在80%以上。那么之前有人解决过这个问题吗？或者任何想法都是值得欣赏的。谢谢。

浏览 0提问于2013-09-29得票数 1

2回答

如何提高Tesseract / Tessnet2的识别速度和准确率？

performance、ocr、tesseract、tessnet2

我已经看到，为了限制扫描错误，您可以为字符定义一个白名单。但是我在ocr.Init(@"c:\temp", "fra", false);中找不到bool numericMode的信息假设您只想扫描数字:将白名单设置为"0123456789“可以正确地获得最佳的识别结果，但是初始化方法的numericMode参数做什么呢？我一直认为它是错误的，即使白名单是"0123456789“。还有什么是最好的位图参数(像素格式)的图像馈送到tessnet。

浏览 1提问于2011-09-14得票数 4

1回答

使用tesseract优化文本识别图像

android、opencv、tesseract

我为我的android项目提供了用户tesseract ocr来识别从相机拍摄的图像中的文本。但结果并不准确。我想使用opencv优化图像。对于以Bitmap.Config.ARGB_8888格式解码的捕获图像，我想实现以下目标：检测调整大小的图像中的对象。确定对象后，计算其边框w.r.t原始图像。(这是为了消除摄像机的角度效应) 通过应用透视变换，从原始图像中提取物体。应用白平衡消除闪电效果。在OpenCV...Your api提供的示例中，他们正在使用Leptonica进行图像处理，比如绘制围绕words..But的边框--在我的例子中--我想使用指导会非常

浏览 4提问于2013-04-05得票数 0

3回答

文字识别OCR接口本地图片下载失败？

python、html、ide、文字识别

用文字识别OCR的Python接口调用来对本地图片进行识别，报错“下载失败”，FailedOperation.DownLoadError message:下载失败。参照这个官方样例https://github.com/TencentCloud/tencentcloud-sdk-python/blob/master/examples/ocr/v20181119/general_fast_ocr.py 接口的Image是图片文件的绝对路径。请问如何解决？

浏览 1512提问于2020-03-07

2回答

Tesseract OCR相机

ios、xamarin.ios、ocr、tesseract

我在我的iOS应用程序中使用了Tesseract OCR3.01，当我从手机的图片库中挑选一张图片时，它显示了90%的准确率。但如果我使用相机中的相同图像，它会显示乱七八糟的字母。我关注了，如果可以做些什么来确保它在相机上工作，就像它在画廊图像上工作一样，请指导我。

浏览 1提问于2012-08-14得票数 2

回答已采纳

1回答

如何解决Android下ML Kit文本识别库的错误？

android、firebase、google-mlkit

我正在尝试使用android ML Kit文本识别库进行文本识别，但在运行时遇到错误，没有返回任何文本。错误： W/TextNativeHandle: Native handle not yet available. Reverting to no-op handle. W/DynamiteModule: Local module descriptor class for com.google.android.gms.vision.dynamite.ocr not found. I/DynamiteModule: Considering local module com.google.and

浏览 317提问于2020-08-26得票数 1

1回答

使用要识别的单词白名单字典加载Firebase Vision OCR

android、firebase、firebase-mlkit

我正在使用Google Firebase Vision API进行文本识别(OCR)。我的用例是对文档中或文档头部的人名进行OCR。此外，我有一个数据库或我希望扫描的姓名列表。我知道其他的OCR引擎支持将单词列表或字典加载到引擎，这有助于提高识别率。我似乎想不出如何使用Firebase Vision文本识别来做到这一点。如果我有一个列表或名称数组，我是否可以将这些名称作为唯一要识别的字符串/单词加载到引擎中？谢谢!

浏览 12提问于2020-03-26得票数 0

1回答

如果我的验证集比我的培训更糟糕呢？

neural-network、cross-validation、training、convolutional-neural-network

我正在运行CNN，在第一阶段，我的训练集的准确率为15%，验证集为12%，到了第51次，我的训练准确率为87%，验证集为13%。这是怎么回事？如果我的验证集低于或大于我的培训集，这意味着什么？(我的测试结果是12%)

浏览 0提问于2018-04-17得票数 0

回答已采纳

2回答

黑名单字符不会被Tesseract OCR忽略

ios、ocr、tesseract

我使用Tessearct来识别图像的字符。但我希望OCR忽略数字字符。 _tesseract->SetVariable("tessedit_char_blacklist", "0123456789"); 通过这种方式，OCR不识别数字字符，但它为我提供了一些我不想要的其他字符。例如:有一个图像的文本为$ 12，当我在该图像上应用OCR时，它提供了美元fl。如上文所示，OCR将12转换为fl，这是我不想要的。我希望12被OCR忽略。有没有办法得到美元而不是美元fl的结果？给我任何解决办法。任何帮助都是有价值的。

浏览 2提问于2013-03-04得票数 3

回答已采纳

5回答

是否有OCR无法识别的字体？

ocr

我正在试着写一个只能被人读懂的文档。无法复制文档内容。为此，我将其页面转换为图片，并将其添加回PDF文件。主要的问题是，任何OCR程序都可以恢复整个书面文本，特别是页面将是清晰的(而不是扫描的书)，这将提高OCR的准确性。那么，有没有OCR无法识别的字体呢？否则，有没有一种技术可以让我的文档只被人类阅读，而不被OCR识别？(例如，添加特定的背景，等等) 提前谢谢你。

浏览 3提问于2012-11-13得票数 4

回答已采纳

3回答