ocr文字识别的工具_ocr文字识工具_ocr文字识 - 腾讯云开发者社区

、、、、

我有一个具有大约300行结构的json文件，如下所示： [ { "OCR":"ANNA żółty LEWANDOWSKA\nHEALTHY SWEETS by Am 31\n", "Correct_title":..., "Correct_author":..., "Correct_ID":... }, { "OCR":"some other\nstuff that should\nst

浏览 6提问于2021-09-09得票数 0

1回答

OCR只返回图像中几个字的大小

、、

是否有任何OCR工具只读取图像中某些单词的坐标()。例如，参考附件图像，我只需要两个单词的坐标，即1)“测量”2) "999999.9mi“ 这能实现吗？我可以考虑将所需的单词作为输入输入到任何OCR工具，如Tessnet2，但没有找到任何合适的功能？任何其他建议都会有帮助。

浏览 4提问于2015-07-08得票数 1

2回答

使用OCR [pdfbox]检测是否从扫描文档中创建PDF。

、、、

我想知道是否使用OCR从扫描文档中创建了PDF。为了使扫描文档中的文本可选，我想相同的文本是用透明的颜色，一种特殊的字体，. 我正在使用pdfbox，我查看了字体、颜色和许多其他属性，我没有发现任何特别的东西。

浏览 2提问于2014-06-12得票数 0

回答已采纳

1回答

MLKIt TextRecognization -如何操作报纸内容中段落的文本块

、

我正在开发一个使用MLKit文本识别的OCR应用程序。OCR的结果是好的，并提供了bouldingBox的每一个字。，我的问题是，我想用适当的块检测技术来扫描报纸，。正如我在MLKit中看到的，它以简单的水平方式搜索文本，但没有给出段落的确切部分。它将多个段落混合在一起并创建TextBlocks。希望你能理解我的问题。谢谢。

浏览 1提问于2021-07-01得票数 0

1回答

Acrobat OCR识别的访问文本

、、

我有PDF文件已经被“识别”使用OCR文本识别->识别文本使用功能在Acrobat。我想把这些作为一个上传(C# ASP.NET MVC)，并能够提取这些信息用于索引和搜索目的。我尝试打开PDF文件，但没有找到任何被识别的文本，所以我猜它是压缩和/或编码的。有什么想法吗？

浏览 0提问于2010-06-25得票数 0

回答已采纳

3回答

在Automation Anywhere中IQ机器人是什么？

、、、

在Automation Anywhere中IQ机器人是什么？我真的很困惑，因为Automation Anywhere的前一个版本已经有了OCR和图像识别的能力，它的区别是什么？

浏览 0提问于2019-10-17得票数 0

2回答

我怎样才能让Tesseract OCR识别电能表的大位数字？

、

我想使用RPi上的OCR程序来识别我的电表照片中的数字。这些数字很大，对我来说很明显，但Tesseract似乎根本认不出它们--充其量它能检测到一些随机错误的数字。我已经尝试过剪切这些数字，并分别对它们进行OCRing，但这并没有帮助。我试过其他几个OCR程序，它们也没有更好。请你给我一些建议，我怎样才能让Tesseract正确地识别出下图中的两个大数字？请注意，这是原始图片是~2.5MB -这个副本更小，以适应这个网站。 📷

浏览 0提问于2017-08-07得票数 0

1回答

无法对tiff和jpeg文件执行OCR

我指的是在tiff和jpeg文件上执行光学字符识别的“”，而是说“找不到尾部字典”，“无法读取外部参照表”，“异常失败(”错误: pdfinfo无法确定页数。检查pdf输入文件。\n“)”虽然从jpeg或tiff文件到PDF文件的转换工作正常，并且PDF文件在alfresco共享页面上可见“，但没有OCR正在处理这些tiff和jpeg文件

浏览 1提问于2017-06-26得票数 0

1回答

如何使用OCR从jpg文件中提取数值

、、、

我创建了以下代码并执行： Ocr.setUp(); Ocr ocr = new Ocr(); ocr.startEngine("eng", Ocr.SPEED_FASTEST); String s = ocr.recognize(theImage, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PLAINTEXT); ocr.stopEngine(); Output: Result: L‘i L‘L’Ui l 实际上，图像只包含数字值。是否可以使用上述代码仅提取数字值？我在jpg文件中显示了1234个数值，我只想在o/p控制台中打印这个

浏览 2提问于2015-11-25得票数 0

回答已采纳

1回答

我还能用什么其他诊断方法来解决这个特殊的Perl问题呢？

、

经过大量的实验，我仍然不能让下面的脚本工作。我需要一些关于如何诊断这个特定Perl问题的指导。提前谢谢。此脚本用于测试Office2007OCRAPI的使用： use warnings; use strict; use Win32::OLE; use Win32::OLE::Const; Win32::OLE::Const->Load("Microsoft Office Document Imaging 12\.0 Type Library") or die "Cannot use the Office 2007 OCR API"; my $miD

浏览 6提问于2010-03-02得票数 3

3回答

android环境下的离线图像文本识别(OCR)

、、

如何构建用于图像到文本识别的android原生SDK。(我对一些来自web服务的API做得很好。但这一次，我只想让应用程序没有任何互联网连接，没有API，也没有Web服务。只是一个离线 OCR应用程序)。所以我的问题是如何裁剪图像中包含的每一个单词？如何比较裁剪文本与字母表和字符？

浏览 7提问于2016-04-06得票数 3

回答已采纳

1回答

寻找从图像中提取文本的库

我所要寻找的基本描述是可以从图像中提取文本(手工编写)，并将其作为一个普通的字符流返回，而无需任何页面处理。更多规格：我正在为我正在开发的软件使用Java，所以拥有一个Java库会很好，尽管如果软件/库有一个二进制文件，那就好了。它应该能够处理的图像是纸上有文字的图片，尽管软件需要识别的是6到66个字符，这些字符将由手工编写，但更多的是“计算机可识别”，有点像这样： 📷 文本必须逐行提取；在表的情况下，只应将每一行和每列视为另一行，不需要进行特殊处理。我自己的研究向我指出了以下软件/库： Asprise 特塞尔 ABBYY云OCR 我已经测试了Tesseract和ABBYY，他们提供的

浏览 0提问于2019-06-08得票数 1

1回答

从pyOCR没有可用的工具

、

我似乎没有正确地安装pyOCR，因为当我安装时，会得到一个空列表： import pyocr.builders pyocr.get_available_tools() 有什么想法吗？我已经通过pip在环境中安装了pyOCR： pip install pyocr --upgrade 编辑下面的人做了这个把戏。 sudo apt-get install tesseract-ocr sudo apt-get install tesseract-ocr-eng sudo apt-get install tesseract-ocr-ell

浏览 2提问于2015-08-08得票数 12

5回答

是否有OCR无法识别的字体？

我正在试着写一个只能被人读懂的文档。无法复制文档内容。为此，我将其页面转换为图片，并将其添加回PDF文件。主要的问题是，任何OCR程序都可以恢复整个书面文本，特别是页面将是清晰的(而不是扫描的书)，这将提高OCR的准确性。那么，有没有OCR无法识别的字体呢？否则，有没有一种技术可以让我的文档只被人类阅读，而不被OCR识别？(例如，添加特定的背景，等等) 提前谢谢你。

浏览 3提问于2012-11-13得票数 4

回答已采纳

1回答

如何重新运行Tesseract OCR？

Tesseract OCR在iPhone 5上的iOS 8.x上运行。它通常在第一张图像(来自相机)上表现良好，但随后会产生垃圾(作为“识别的文本”)。我假设Tesseract库中有某种内部状态需要在每次重新运行之前清除(即，相同的应用程序实例，但对于第一次之后运行的所有OCR )。有没有人知道在重新运行Tesseract之前应该采取什么特别的步骤？谢谢。

浏览 0提问于2015-11-09得票数 1

1回答

PDFBox:区分透明文本和非透明文本

、、、

我有一个任务，在那里，我必须提取文本，是背后的图像，并已从图像本身OCR编辑。这一案文是透明的。问题是，有一个图像，它的背后有文字，不是OCR编辑的，它只是正常的文本，它是不透明的。如何区分所需(透明)和不需要(不透明)文本？这是一个具有代表性的pdf文件：图像OCR文本应该在第2页、第3页、第12页上提取，而文本也在第4页上提取。在第4页，图像后面没有OCR文本，但是图像下面有规则文本。我需要过滤掉它，因为我只需要OCR文本。

浏览 6提问于2021-07-13得票数 0

回答已采纳

1回答

人脸搜索的推荐阈值是多少？

浏览 254提问于2022-06-15

2回答

Windows ocr能识别自定义符号/字体吗？

、、、、

我正在为UWP开发，Windows有一个OCR引擎: Windows.Media.Ocr 我的问题是:有人知道Windows OCR是否可以接受识别新字符或使用自定义字体的培训？如果是的话，我怎么能做到？我想要实现的是识别非字母符号。我想在每个例子中识别字符⌰(unicode: U+2316)或⌖(U+2316)。我想识别的字符不是任何语言的符号。

浏览 9提问于2016-03-07得票数 3

回答已采纳

1回答

使用IronOCR Tesseract在C#中读取图像中的文本

、、

根据这个Link，我安装了IronOcr包，并尝试了以下代码。 using IronOcr; var Result = new IronTesseract().Read(path); string currentSubText = Result.Text; textBox1.Text += currentSubText + Environment.NewLine + Environment.NewLine; 我用六张图片进行了测试：图片 ? 图片 ? 图片 ? 图片 ? 我可以上传四张照片。实际上它看起来不错。只有几个错误与一些特殊的德语字符(äöü) 结果1： ?

浏览 309提问于2021-09-06得票数 1

3回答

如何提高文本识别usingTesseract OCR。？

、、、

我在I中实现了文本识别的tesseract ocr，对输入图像进行了预处理，给出了Tesseract method.It，识别效果较差。步骤： 1.侵蚀功能 2.扩张功能 3.Bitwise_not函数 Mat MCRregion; cv::dilate ( MCRregion, MCRregion, 24); cv::erode ( MCRregion, MCRregion, 24); cv::bitwise_not(MCRregion, MCRregion); UIImage * croppedMCRregion = [self UIImageFromCVMat:MCRreg

浏览 1提问于2014-08-28得票数 4

1回答

pc端微信的图片文字提前，也是用OCR技术实现吗？

、

常用的OCR技术对电脑GPU都有要求，微信是怎么规避这个问题的呢？有没有大神解答下，谢谢

浏览 231提问于2022-12-07

1回答

如何判断pdf文件中隐藏的文本层是否来自OCR？

我见过一些pdf文件后，OCR有非常准确的文本(无论是在识别率，在文本对齐图像)。如果pdf文件中隐藏的文本层是否来自OCR，那么Unix/Linux工具会帮助我知道什么呢？

浏览 0提问于2014-12-07得票数 2

1回答

使用xsane作为没有扫描器的OCR

、

当我启动xsane时，它会以不可访问的消息退出。但是我想用它作为OCR工具。如何抑制设备搜索？

浏览 0提问于2015-07-03得票数 1

1回答

我们调用你们的ocr识别的时候，对于识别的信息的安全性，是否可以保证，比如是否会保存识别的对象信息？

、

我们调用你们的ocr识别的时候，对于识别的信息的安全性，是否可以保证，比如是否会保存识别的对象信息。标题：API概览 - 智能图像服务 - 产品文档 - 帮助与文档 - 腾讯云地址：https://cloud.tencent.com/document/product/641/12407

浏览 321提问于2018-01-24

1回答

OCR中的格鲁吉亚语

、

我在将包含文本图像的JPG文件转换为文本文件时遇到问题。我尝试了ABBYY的OCR SDK和其他一些OCR来源，但它们都不包含乔治亚语。您能告诉我有没有可以用于格鲁吉亚语言的OCR源？提前感谢您的帮助！

浏览 2提问于2013-08-20得票数 4

3回答

OCR是如何工作的？以及如何将OCR添加到字母表

、、

我有一个以前没有处理过的字母表，所以当扫描时，没有办法用OCR来检测要识别的字母。我正在尝试为它编写OCR程序，但在这方面没有太多经验。对于从哪里开始，以及这样的系统通常是如何实现的，我希望能得到一些提示。

浏览 0提问于2012-02-24得票数 3

2回答

新版OCR身份证识别，SSL认证问题？

、、、、

使用新版SDK（java）调用ocr身份证识别接口ocr.tencentcloudapi.com，在云服务器上报一下错误 com.tencentcloudapi.common.exception.TencentCloudSDKException: javax.net.ssl.SSLPeerUnverifiedException-Hostname ocr.tencentcloudapi.com not verified: certificate: sha1/2oGH1NU0zoUGcAYBTGnGkeHt4LQ= DN: CN=*.ap-shanghai.tencentcloud

浏览 1427提问于2019-09-06

1回答

Python OCR库或手写字符识别引擎

、、

你能推荐一些用于OCR和手写字符识别的python库或源代码吗？

浏览 0提问于2009-11-10得票数 13

回答已采纳

1回答

ios中OCR的最佳免费库

、

我想从图像中得到文字信息。我已经尝试过Tesseract库来实现OCR。但我不能从这个图书馆得到最好的结果。请建议更多的解决方案，在iphone/目标c中OCR扫描文本。我需要新的和更新的免费框架，在文本识别的最大准确性。请给我建议。提前谢谢。

浏览 5提问于2016-01-13得票数 0

回答已采纳

4回答

如何从图像Android应用程序中提取文本

、、、

我正在为我的Android应用程序开发一个功能。我想从图片中读取文本，然后将该文本保存在数据库中。使用OCR是最好的方式吗？还有别的办法吗？谷歌在其文档中建议，只有在严格必要的情况下才应该使用NDK，但是到底有什么缺点呢？任何帮助都是最好的。

浏览 0提问于2016-05-18得票数 18

2回答

基于图像的OCR - iOS

、、、

是否有可能在图像(例如资产)上执行OCR，而不是使用Anyline、microblink或其他SDK的实时视频？由于时间有限，Tesseract不是一种选择。我已经测试过了，但是结果很不合适。我知道可以用OpenCv或者别的什么来改进它，但是我必须留出最后期限。编辑：这是图像到达OCR时的一个示例。

浏览 4提问于2016-12-13得票数 1

回答已采纳

1回答

OCR多幅图像合并成一个PDF格式

、、

有没有人有经验，如何OCR几个图像，并创建一个输出PDF文件与识别的文本在C#中的Nicomsoft OCR？看起来它可以做到，但是我的C#代码由于某些原因没有生成任何PDF： NSOCRLib.NSOCRClass NsOCR = new NSOCRLib.NSOCRClass(); NsOCR.Engine_InitializeAdvanced(out CfgObj, out OcrObj, out ImgObj); for (i = 0; i < ImageCnt; i++) { NsOCR.Img_LoadFile(ImgObj, ImageFiles[i]); N

浏览 13提问于2015-04-28得票数 1

回答已采纳

1回答

如何利用OpenCV使图像清晰清晰

、、

所以我想要OCR，一个有文字的图像但是输出总是很奇怪，与图片中的文本不匹配。所以我决定改变图像属性。我就这样改变它： image = cv2.imread("./image_frames/frame473.png") def get_grayscale(image): return cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) def blur(image): return cv2.medianBlur(image,3) def thresholding(image): return cv2.thres

浏览 0提问于2020-06-25得票数 2

1回答

Tesseract-OCR (3.02)识别精度和速度

、

我有一组非常小的图片(w:70-100；h:12-20)，如下所示：在这些图片中，除了组成员的昵称外，什么都没有。我想从简单的图片中阅读课文，它们都有一个背景，只是昵称不同。所以，我对这张照片所做的是：我正在使用下面的代码从第二个图像中获取文本： tesseract::TessBaseAPI ocr; ocr.Init(NULL, "eng"); PIX* pix = pixRead("D:\\image.png"); ocr.SetImage(pix); std::string result = ocr.GetUTF8Text();

浏览 1提问于2016-07-02得票数 6

回答已采纳

4回答

识别azure表单识别器中的复选框

、、

我想在表单识别器中使用的表单有几个复选框。目前，表单识别器的OCR引擎似乎不能检测复选框。有没有解决这个问题的办法，或者有没有训练复选框识别的方法？我也尝试过在windows和linux上使用tesseract，但在那里我也解决不了。复选框是您的标准开放方块。有时，它们可能会有一个"x“或复选标记。如果没有解决方案，我可能会要求客户将复选框更改为实心圆圈(单选按钮)。我还没有测试过，看看OCR会对它们做些什么。编辑:我阅读了表单识别器文档，我看到它明确指出不支持复选框和单选按钮。我想知道有没有人有解决办法？

浏览 4提问于2019-07-15得票数 1

1回答

从可搜索的pdf中读取，不带ocr

我目前正在使用扫描仪将我的PDF转换为可搜索的PDF。OCR已经处理好了，因为我可以在PDF中使用ctrl-f。但是，我如何才能从我的程序中获取OCR的内容。我对使用java和ruby持开放态度，这个问题是编程语言不可知的。是否可以通过读取文件来公开访问OCR文本？

浏览 1提问于2011-12-15得票数 0

1回答

表单识别器OCR准确性问题

、、

我正在尝试从扫描的身份证中提取数据，但遇到了光学字符识别准确性的问题。这是一些额外的小字后面的名字，这是混淆了身份证上的常规名称。表单识别器中的OCR不准确。我尝试了计算机视觉3.0-预览读取API，它工作正常。有没有办法将新的3.0计算机视觉OCR API与表单识别器2.0一起使用？我看到一些文档，其中提到在容器中使用表单识别器时使用计算机视觉的API？如果我们使用云中的表单识别器API而不是本地容器，是否可以指定OCR API？

浏览 5提问于2020-05-18得票数 0

1回答

使用要识别的单词白名单字典加载Firebase Vision OCR

、、

我正在使用Google Firebase Vision API进行文本识别(OCR)。我的用例是对文档中或文档头部的人名进行OCR。此外，我有一个数据库或我希望扫描的姓名列表。我知道其他的OCR引擎支持将单词列表或字典加载到引擎，这有助于提高识别率。我似乎想不出如何使用Firebase Vision文本识别来做到这一点。如果我有一个列表或名称数组，我是否可以将这些名称作为唯一要识别的字符串/单词加载到引擎中？谢谢!

浏览 12提问于2020-03-26得票数 0

1回答

图像拼接与OCR

、、、

想象一块金属棒，长20毫米，圆约30毫米。吧台上印着数字。10个字符，4.5 of高，围绕大约120°的圆周展开。我需要对字符执行OCR，但文本字符在一张图像中并不都可见。间隔在30°左右的三张图像看起来没问题。下一个问题是金属是新加工的，文本字符似乎不能很好地OCR；我认为是由于缺乏真正的对比度。即黑/白的区别。有谁知道这些字符是如何被OCR识别的吗？

浏览 0提问于2012-08-07得票数 0

2回答

ocr身份识别可以识别ps后的图片吗？

把正常图片的身份证号码PS修改处理后，ocr识别的结果是ps之前的身份证号码

浏览 741提问于2019-01-16

4回答

OCR纠错:如何合并三个错误结果以减少错误

、、

问题所在我试图通过合并来自三种不同OCR系统(tesseract、楔形信息、ocrad)的输出来改进OCR过程的结果。我已经做了图像预处理(干洗，鄙视，三和更多)。我不认为这部分可以改进得更多。通常需要识别的文本长度在1到6个字之间。文本的语言是未知的，它们经常包含幻想词。我在Linux上。首选语言是Python。到目前为止我拥有的通常每个结果都有一个或两个错误。但它们在不同的字符/位置上有错误。错误可能是它们识别错误的字符，或者它们包含一个不存在的字符。他们不常忽视一个角色。一个示例看起来可能如下所示： Xorem_ipsum lorXYm_ipsum lorem_ipuX X是错误

浏览 3提问于2010-09-10得票数 6

1回答

带有Kivy应用的Tesseract OCR

、、、

可以将Tesseract-OCR (或Tess-Two)与Kivy应用程序集成吗？我希望创建一个使用Kivy框架的基于OCR的文本识别的Android应用程序。我在我的PC上使用Tesseract API已经有一段时间了，我想知道是否有一种方法可以在Kivy应用程序中使用它的功能。如果没有，有没有其他选择？

浏览 18提问于2017-08-28得票数 2

2回答

Pip安装tesseract-ocr :退出状态2失败

、、、、

我已经尝试安装Tesseract-ocr库很长一段时间了。阅读许多与其他软件包相关的类似问题，并给出解决方案，但都没有效果。我认为问题在于我的。给定以下代码，出现了一个错误：错误:命令'c:\Program (x86)\Microsoft 10.0\VC\Bin\x86_amd64\cl.exe‘在退出状态2中失败我卸载、重新安装、更新并尝试了许多事情，但仍然无法工作：已经谢谢你了！ C:\Users\af>pip install tesseract-ocr Collecting tesseract-ocr Using cached tesseract-ocr

浏览 2提问于2017-03-04得票数 1

回答已采纳

1回答

Heroku自动完成导致“无法定位本地/lib.pm”错误

、、、、

我尝试了brew update，在Heroku自动完成安装之后，我开始得到以下错误。我怎样才能解决这个问题？无法在@INC中找到本地/lib.pm(您可能需要安装本地：：lib模块) (@INC包含:/Users/franklin/perl 5/lib/perl 5 /usr/local/Cellar/perl/5.28.0/lib/perl5/site_perl/5.28.0/darwin-thread-multi-2level /usr/local/Cellar/perl/5.28.0/lib/perl5/site_perl/5.28.0 /usr/local/Cellar/perl/

浏览 0提问于2018-12-02得票数 0

1回答

打开cv找不到镜像

、、

代码： String imageName( "test.jpg" ); Mat image = imread( imageName,IMREAD_COLOR ); if( image.empty() ) { cout << "Could not open or find the image" << std::endl ; return -1; } namedWindow( "Display window", WINDOW_AUTOSIZE ); ims

浏览 1提问于2017-06-15得票数 0

1回答

Leadtools - OcrException -未启用

、、

我正在使用Leadtools OCR 我引用了以下DLLS： Leadtools.dll Leadtools.Barcode.oneD.dll Leadtools.codecs.dll Leadtools.codecs.fax.dll Leadtools.codecs.png.dll Leadtools.codecs.tif.dll Leadtools.Forms.DocumentWriters.dll Leadtools.forms.ocr.dll Leadtools.forms.ocr.Advantage.dll 和以下代码将Png文件转换为Pdf private void button1

浏览 13提问于2015-05-22得票数 3

1回答

如何检查图像中的自定义字符？

、

我有一组可以识别的图像文件。我希望只搜索集合中的匹配项，而不是OCR。什么是快速查找匹配的理想平台？

浏览 1提问于2011-01-07得票数 2

回答已采纳

2回答

将图像转换为可搜索的pdf

、、、

嗨，我正在寻找一个开源的java API，可以将tiff图像转换为可搜索的pdf (OCR)。我周围有研究，但到目前为止什么也没有发现。注意：，我看过这篇文章，但是这个API并没有将图像转换成pdf 。然而，我仍然在玩一些代码。

浏览 6提问于2012-02-01得票数 5

2回答

图像到文本-移除python 2.7中的非ascii字符

、、、、

我正在使用pytesser对OCR进行OCR，并从中获取一个字符串： image= Image.open(ImagePath) text = image_to_string(image) print text 然而，皮特塞喜欢有时识别和返回非ascii字符。当我现在要打印我刚刚识别的内容时，问题就会发生。在python2.7(这是我正在使用的)中，程序会崩溃。有什么办法使它不返回任何非ascii字符？也许您可以在tesseract OCR中改变什么？或者，有什么方法可以测试字符串中的非ascii字符(而不破坏程序)，然后不打印这一行？有些人建议使用python3.4，但从我的研究来看，p

浏览 5提问于2014-07-24得票数 3

回答已采纳

1回答

“iText7 PdfTextExtractor.GetTextFromPage”“StandardEncoding”不是受支持的编码名称。

我有一个方法，在我们的软件，从PDF，从扫描或文本生成的文本。我通常先尝试GetTextFromPage()方法。如果它不返回文本，那么我将移到页面的OCR上。我有一个特别的6页PDF，前三页是扫描文件，最后两页是一份表格。在这个PDF文件中，我得到了一个我无法解决的错误。 'StandardEncoding' is not a supported encoding name. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProv

浏览 7提问于2020-04-27得票数 0

回答已采纳