图像字符识别_字符识别_OpenCV -图像文本增强-光学字符识别预处理 - 腾讯云开发者社区

、

我正在寻找布局分析库或工具(最好是开源的)，可以应用于文本PDF，以识别主要文本内容与侧栏，章节标题，章节标题(甚至可能是具有装饰/阴影和下划线的花哨的标题)等。我遇到了像OCRopus这样的工具，它们使用光学字符识别和图像识别来识别布局。有没有库可以在没有OCR的情况下做同样的事情？可以从文本PDF中提取文本和图像，并将包含文本和图像位置的输入提供给该工具；对于此类文件使用OCR将是相当繁琐的。

浏览 2提问于2013-05-08得票数 2

回答已采纳

1回答

我可以获得与特定文件关联的关键字列表吗？

也就是说，对于执行OCR的图像，我希望能够获取图像上的文本列表。使用SDK可以做到这点吗？如果是这样的话，如何使用google的OCR来获取图像中的单词，如果没有，有什么建议吗？

浏览 1提问于2012-07-03得票数 25

回答已采纳

3回答

java的任何OCR技术

、

我有MCA最后一年的项目，以提取数据从图像(jpg，gif等)。我想从图像中识别数据。我已经使用了java ocr，但它不工作。有没有可以帮到我的开源库？

浏览 0提问于2010-03-10得票数 0

1回答

Python Google Drive API :上传的图像显示在文档中

、

我正在使用以下代码从我的python应用程序将图像上传到google drive： import logging from django.core.management.base import BaseCommand from apiclient.discovery import build from apiclient.http import MediaFileUpload import httplib2 from gdoauth2.models import DriveCredential class Command(BaseCommand): def handle(s

浏览 0提问于2013-06-14得票数 0

回答已采纳

4回答

将图像转换为文本- Java

、、、

这是一个有趣的话题。基本上，我有一个包含一些文本的图像。如何从图像中提取文本？我已经尝试了很多东西，但我做的每一件事都非常单调乏味，而且通常都不起作用。我只是想知道是否有一种相当简单的方法来做到这一点。我发现了这一点：。我已经试了几个小时了，但我不能让它从图像中获取Image并将其转换为文本的String。提前感谢大家！

浏览 6提问于2012-05-03得票数 12

回答已采纳

1回答

图像处理中的数字识别算法/准则

、、、、

我正在努力学习图像处理，在这方面我给自己设定了一个目标。一个数字识别系统。所以我用Alasdair McAndrew的Matlab语言介绍了数字图像处理，并学习了边缘检测，阈值，膨胀和侵蚀以及命中和缺失变换等知识。现在的问题是，我很难想象这些工具如何帮助我实现我的目标。我还有其他一些关于图像处理的书，虽然每个人都在教如何侵蚀或膨胀，但没有人告诉我，如果我想识别图像中的对象、数字或字符，该怎么做。这真的很令人沮丧，因为在网上查找这个问题会给出非常普遍和宽泛的答案。谁能告诉我如何从我自己用这些技术在绘画中制作的图像中识别数字。如果不能，至少可以给我推荐一本书，甚至是一个领域，因为在看了

浏览 5提问于2013-03-20得票数 0

1回答

如何从表单的扫描图像中提取数据？

、、、

我有一些扫描表单的数据。表格的格式是预定义的，我也有空表格的图像。我想从表单中提取每个值的信息。任何已知的用于图像处理的R或python解决方案或库都可以帮助实现这些值。我已经在python中尝试过openCv，但是没有成功。有什么解决方案吗？ PFA这两种类型的图像我都有截图。空表单图像：- 已填写表单图像：-

浏览 1提问于2017-07-22得票数 4

1回答

有没有办法在C#中“读”一个gif/jpeg文件？

、

我需要从gif/jpeg中读取具有文本和图像组合的文本。希望所有的gif都是标准格式，以便我使用regex (也许？)从图像中提取文本。任何关于这方面的意见都是非常感谢的。

浏览 0提问于2009-10-31得票数 0

1回答

如何在自然文本图像中检测字符？

、、

我有一个关于字符识别的项目(使用openCV库)。我不知道如何在文本图像中检测字符。你能推荐一些方法来做到这一点吗？谢谢大家！

浏览 5提问于2013-11-28得票数 0

1回答

提取PDF中表示为图像的文本- itextsharp

、、、

我在使用ITextSharp从PDF文件中提取文本的过程中，我已经成功地提取了我感兴趣的文本的一部分，但当我继续我的‘文本’提取时，我注意到一些文本单词(当我使用itextsharp从整个页面提取整个文本时无法获得文本)实际上被表示为图像。Adobe Reader已经向我确认了这一点。因此，简而言之:如何提取包含在PDF图像对象中的文本？我是否必须提取图像并找到另一种方法将其转换为文本？这是一个非常可怕的行星排列对我来说..有人遇到过这个问题吗？

浏览 4提问于2013-06-07得票数 2

回答已采纳

1回答

基于Jmeter的图像文本提取

、、、

我需要从磁盘上的图像中提取数字(数字)。我们有没有可以做到这一点的jmeter的库/插件？例如，我有一个图像在磁盘上，我想从这个图像中提取数字。我的输出应该是: 5693478605

浏览 1提问于2016-11-09得票数 0

4回答

通过java程序从图像中读取字符值

、

大家好，如图所示，我有一个带有字段Username & City & Work的图像，如图所示。我只想用java程序从这个图像中读取这些字符字段的值。如果有人对此有任何想法，请让我知道谢谢

浏览 5提问于2013-01-16得票数 7

回答已采纳

1回答

谷歌云存储支持OCR？

、、

Google Cloud Storage有一个搜索机制来使用OCR (光学字符识别)来查找图像文件吗？例如，有可能在谷歌云存储中搜索图像文件文档，按其内容？就像在Google Drive里一样。

浏览 0提问于2015-06-27得票数 0

1回答

Android获取图片和获取捕获图片中的文本

、

我正在尝试制作一个应用程序，通过使用android来拍摄图像，然后从捕获的图像中获取文本(它可能像OCR一样)。如果有人知道这件事，请帮帮我。谢谢。

浏览 0提问于2012-10-31得票数 0

2回答

通过Javascript或PHP将图像转换为文本？

、、

可能重复：是否有任何脚本可以将包含文本的图像转换为纯文本，最好使用Javscript或PHP？例如，以下面的图像为例：我希望这个图像被转换成简单的“ABCDEFGHIJK”。

浏览 5提问于2012-04-16得票数 2

回答已采纳

1回答

从uiimageView读取

、

我想知道，从相机中获取图像是可能的，如果图像包含任何数字，它会从图像中读取这些数字，并在文本字段中显示它们。我读到过关于ZBAr的文章，但这完全是另一回事。有没有人知道类似的事情？谢谢

浏览 0提问于2011-04-01得票数 1

回答已采纳

1回答

如何在OpenCV中进行字符匹配

、、

我正在尝试开发一个字符匹配应用程序，将采取从相机的图像，并与提供的图像模板匹配。到目前为止，我已经尝试了轮廓的matchShapes，它在字符上不能正确工作，它在简单的形状上工作得很好。我试过使用matchTemplate，但如果我改变从相机捕获的图像中字符的大小、字体或旋转，并尝试将其与模板图像进行匹配，也无法正常工作。我现在认为我需要在对相机图像进行集合分割后进行特征提取，并将这些集合与参考图像的特征集进行比较。有人能给我一个开始的方向或建议吗？例如，这是来自相机的图像我需要找到一个模板图像

浏览 3提问于2015-01-24得票数 2

1回答

在Pyocr中将文本方向从左更改为右

、、

我将pyocr与Pillow和OpenCV结合使用来从PDF文档中提取文本。但是，PDF文档是表单，这意味着在某些情况下，表单中项目的标签位于文档的最左侧，项目的值位于文档的右侧。例如(添加点作为间距，但不存在于图像中)： oranges:......................................$15.75的价格 apples:.......................................$12.51的价格当我将图像转换为文本时，它将如下所示：橙子价格:/n苹果价格/n$15.75/n$12.51 基本上，文本是从上到下，然后从左到右，而不是从左到右，然

浏览 32提问于2017-07-01得票数 0

1回答

使用Tesseract-OCR进行图像到文本的识别比使用我的Python代码手工预处理图像更好

、、、、

我试图用Python编写代码，用于使用Tesseract-OCR进行手动图像预处理和识别。手册过程：为了手动识别单个图像的文本，我使用Gimp对图像进行预处理，并创建一个TIF图像。然后我把它喂给Tesseract-OCR，它正确地识别了它。用Gimp对图像进行预处理- 将模式更改为RGB /灰度菜单--图像--模式- RGB 脱粒菜单--工具--彩色工具--阈值--自动将模式更改为索引菜单--图像--模式-索引调整大小/比例至宽度>300 to 菜单--图像--缩放图像-- Width=300 保存为Tif 然后我给它喂食- $ tesser

浏览 3提问于2015-09-09得票数 6

1回答

从图片python中识别明文

、、、

我用pytesseract从图像中识别文本 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 然后我使用下面的代码来识别文本 textImg = pytesseract.image_to_string(Image.open(imgLoc+"/"+imgName)) print(textImg) text_file = open(imgLoc+"/"+"oriText.txt", "w")

浏览 2提问于2019-05-25得票数 0

2回答

图像处理软件

我需要处理图像中的文本。该图像是仪表读取数据的图像。我尝试了和其他几个免费的在线图像处理软件，但他们不能正确读取数据。哪些是最好的图像处理软件(包括免费软件和共享软件)，可以准确读取仪表数据？ PS:我需要从处理后的图像中获得准确的读数。所以，我不能处理不恰当的数据。要处理的图像可以在链接上找到。

浏览 2提问于2013-08-26得票数 0

1回答

将图像转换为wp7文本

我正在为wp7开发应用程序，并且对这些东西很陌生。我希望将图像转换为文本，就像选择现有图像或捕获新图像一样，如果该图像中存在文本，则应该在TextBox上显示这些文本。有人能帮我这个忙吗？提前谢谢！

浏览 1提问于2013-02-09得票数 1

回答已采纳

1回答

将包含文本的图像转换为可编辑文本

我有一个从硬拷贝扫描的pdf文件。因此，pdf文件具有硬拷贝的图像。现在，当我尝试将pdf转换为word时，我得到的不是可编辑的文档，而是word文档上的图像。有没有办法使它成为一个可编辑的word文档？有没有什么软件程序或东西能帮我做到这一点？

浏览 4提问于2011-02-24得票数 2

回答已采纳

1回答

阅读图片中的文本的最佳Python/Ruby库

、、、、

有没有人知道python/ruby中可以分析图像并从中提取文本的库？或者是一本关于图像处理的书。 PS:文本是各种字体和格式，但清晰，Tl;Dr:没有验证码或类似的。

浏览 2提问于2012-07-15得票数 3

回答已采纳

1回答

图像处理:根据字体类型和大小对文本进行分类的API

、、

我正在寻找一个API，可以将图像作为输入，并根据字体类型和字体大小对图像中的文本进行分类/识别。现在，这些图像是移动应用程序中的屏幕截图，因此代表了完美的字体，并且不会像手写文本或打印文档的图像那样失真。我浏览了一些可用的API，比如Google Vision API，但我找到了一个解决方案。任何帮助都将不胜感激。提前谢谢。

浏览 0提问于2017-10-20得票数 3

1回答

模糊识别图像中的字符

我正在寻找一种合适的算法，可以识别出与已知字母图像略有不同的图像是否匹配。也就是说，我知道下面的图像是字母s、t、e和v。我该如何检测类似字体(字体系列、大小和粗细)的字母s的另一个图像是同一个字母？

浏览 0提问于2012-03-19得票数 2

1回答

使用iphone/ipad扫描或读取答题纸上包含光学标记的图像

、、、、

在iOS中开始进行操作维护处理的最佳方式是什么？我需要扫描包含标记的椭圆形的答卷，然后使用iphone/ipad处理结果？我是新手，所以任何帮助都是很好的？包括用于运维的SDKS。但是找不到好的文档。有没有更好的工具/way来做这件事？我是否应该考虑研究图像处理和检测图像上的椭圆形状？ iOS是否提供了任何框架来支持或简化这一点？

浏览 1提问于2013-11-07得票数 4

1回答

是否可能在图像和文本之间进行转换？

、

我有一本扫描过的书作为图像压缩到PDF文件中，我希望保持原样，但希望从图像中提取文本，这样就可以选择/复制它。在Linux下有办法做到这一点吗？

浏览 0提问于2016-06-14得票数 0

回答已采纳

1回答

文本识别库，Android代码，Java？

、、、

有人能推荐一个适用于Android、Java的文本识别库或代码吗？我需要从图像中进行一些文本识别。我只能找到与android图像类不完全兼容的Java代码。

浏览 1提问于2012-12-26得票数 2

1回答

在python中进行手写字符识别的步骤是什么？使用opencv和sci工具包学习？

、、、、

我的项目是承认手写的泰米尔字符使用python，opencv和scikit-学习。输入文件：手写的泰米尔语字符图像。输出文件：文本文件中已识别的字符。做这个项目的基本步骤是什么？我知道三个步骤，预处理，特征点提取和分类。但是，我不知道如何进行这个项目。如何进行预处理？培训数据集图像存储在哪里？如何在opencv中提取特征点？如何实现这一点？请帮忙..。

浏览 3提问于2016-02-13得票数 4

回答已采纳

1回答

以编程方式从图像中读取文本

、、

我的问题类似于，只不过我正在寻找一种以编程方式实现它的方法。从本质上说，是否有人知道一个好的、简单的、与.NET兼容的库，它能够接收到一个位图对象或图像对象，并返回该图像上的任何文本？干杯

浏览 3提问于2009-06-29得票数 0

回答已采纳

1回答

Halcon -检测与局部环境相比的亮点

、

我需要检测图像中的明亮区域。使用阈值将会非常容易。但我需要获得与周围环境相比明亮的斑点，而不是基于绝对值。做这件事的好方法是什么？不幸的是，我目前没有样本图像。

浏览 46提问于2020-07-13得票数 0

回答已采纳

2回答

检测只包含文本的图像

、、、

我有一个数据库，里面有两种图像：图片与文字整合与否只包含背景颜色和文本的图像。我有一个，我只想发送给客户的照片。是否存在任何简单而快速的算法来检测图像是否仅仅是一个背景，上面有文本？应该使用什么类型的方法？提前感谢

浏览 6提问于2012-07-10得票数 4

回答已采纳

1回答

Microsoft认知服务视觉API确实检测到代码中的任何字符。

、、、、

我有一个代码块，它使用OCR功能调用微软认知服务远景API。当我将一个特定的图像传递到API调用中时，它不会检测到任何单词。调用本身成功并返回200状态。当我通过Microsoft提供的演示UI屏幕使用相同的图像时，它工作并读取我所期望的字符。如果我转到这个URL 并上传这个图像然后，它工作和回来的201 19 4501。当我尝试对相同的图像使用下面的代码时，它返回的不返回任何字符。这是密码。下面的ScaleImageIfNeeded方法没有做任何事情，因为图像已经缩放到合适的大小(它只是返回字节数组中传递的相同值)。 public async Task<string>

浏览 3提问于2017-07-25得票数 1

2回答

如何在C#中读取位图中的文本？

、

我正在创建一个严重依赖于图像识别的程序。我通过截图来实现这一点，然后确定在截图的位置是否存在预先确定的图像。然而，对于我的程序，我还需要能够拍摄一个位置的屏幕截图，其中将有文本，特别是数字。它将是常规的，使用相同的字体，但每次都是不同的数字。如何将位图中的此类信息转换为可在代码中使用的整数？谢谢。

浏览 0提问于2014-05-30得票数 0

1回答

我如何微调一个模型来检测数字，用于检测纸币的面值。

、、、、

因此，手头的任务是检测任何货币纸币的面值。我拥有的数据集大约是每个面额的2k图像(总共12张)。例如，钞票(去除噪音、腐蚀、膨胀等后)如下： 📷 📷 它是否有可能微调一个数字检测(在野生)模型(例如那些使用SHVN数据集训练)，使其成为多位数字检测器？还是简单地使用多位检测器作为基本模型并对其进行训练(传输学习)是更好的选择？用我的钞票数据集？我还想要一些关于定位钞票上数字位置的想法，因为使用CNN的检测会更可靠，如果我给它提供一个裁剪出来的图像，其中只包含数字。我试着用pyTesseract来做这个，但是即使在修改了设置之后，它也没有给出令人满意的结果。还有其他方法可以用于这种本地化吗？

浏览 0提问于2022-06-16得票数 1

2回答

如何使用Java读取图像？

、、、

我一直在使用一个软件，作为一个阅读扫描仪的工作。基本上，它从图像中检索文本。是否有任何API能够以编程方式识别图像中包含的文本，特别是.tiff中的常规文本？或者有什么Java类可以帮助.我不知道怎么开始

浏览 4提问于2013-10-05得票数 2

回答已采纳

1回答

无法使用OCR检测数字

我尝试使用Azure Cognitive Services OCR获取数字及其在图像中的位置，但它无法检测图像中的任何数字。这是。(我使用的是来自的示例代码) 谢谢你，阿特

浏览 16提问于2017-07-03得票数 1

1回答

Android OCR (光学字符识别)

、、

我想开发一个从图像中读取文本的应用程序。我应该使用哪个库？

浏览 0提问于2011-08-19得票数 2

回答已采纳

1回答

基于小波变换的边缘检测

我已经使用小波变换做了边缘检测，使用以下步骤将图像转换为灰度图像使用dwt2(离散小波变换，哈尔小波滤波器)将图像分解为水平，垂直，对角线和近似(细节)进一步分解水平部分阈值(全局阈值，如精明的边缘检测)我得到了边缘，但我在定位边缘以完成图像时遇到了问题，这意味着只使用边缘恢复原始图像，所以我需要关于这方面的帮助，无论是在概念上，还是在实验室代码或参考资料中我希望能尽快得到您的帮助

浏览 2提问于2010-05-14得票数 1

2回答

如何在android中获取图片上方的文本？

、、

我有一张上面有文字的图片。我需要从图像中提取文本。例如:假设我有一个图像，在图像的顶部，我有一个标志"NOKIA“。我想从图像中提取徽标作为文本。

浏览 6提问于2013-03-11得票数 0

2回答

图像处理-可重用代码

我要开始从事一个图像处理项目，并希望从图像的基本字符识别的一些信息，就像从图像中读取一个数字一样简单。所有我正在寻找的是逻辑和一些可重用的代码将是伟大的。谢谢

浏览 3提问于2012-10-30得票数 1

1回答

无法从弹出窗口提取文本

、、

我无法从弹出窗口中提取或获取文本。我使用了下面的代码： Driver.findElement(By.xpath("xpath of popup")).getText(); 这是一个div图像弹出窗口(如果有帮助的话)。我想将文本从窗口中取出并在控制台中打印出来。当我使用上面的代码时，它只是通过了测试，并没有从图像中获得文本。

浏览 4提问于2014-12-05得票数 0

2回答

使用python / django进行复杂的图像分析

、、、

我正在做一个django项目，它分析包含文本的图像，(1)推断图像是否需要旋转，(2)文本区域在哪里。我目前正在使用PIL对这些图像进行一些更简单的处理，但我不太确定如何使用PIL或其他库来执行这两个任务。我想知道以前是否有人这样做过，是否有库/ api可以帮助开发。

浏览 0提问于2011-06-26得票数 4

回答已采纳

1回答

从屏幕上读取字符

、、、

很长一段时间以来，我一直在努力寻找解决我的问题的方法。我需要建立一个程序，从屏幕上读取数据，识别字符和图像，然后根据字符和图像采取行动。例如，我给它提供了一张狗的图片，每个可能角色的图片，它可以读取屏幕，告诉我狗在哪里，角色在哪里，顺序是什么等等。有没有免费的库？我更喜欢可以在C#或Vb.net中使用的东西

浏览 0提问于2010-02-16得票数 1

2回答

asp.net中图像中的字符识别

、、

我想拍摄一张图片，并索引该图片中的单词，让用户搜索该图片，然后在关键字周围显示突出显示的图像。所以，我需要的是一个OCR类，它可以获取图像，并给我一个单词列表和它们的坐标？有可能吗？

浏览 3提问于2009-09-29得票数 2

2回答

iOS Objective-C中的自动白平衡

、、、

我正在尝试修复iOS上一张图片的白平衡。在我的应用程序中，人们可以拍一张照片，然后得到两样东西: OCR和图像的“改进”版本。为了进行光学字符识别，我使用GPUImage (使用GPUImageAdaptiveThresholdFilter)改进了图像。但该图像仅由黑白像素组成。对于我的“改进”版本，我想要有：-正确的颜色平衡(意思是当我在里面拍照时，我的白色是真正的白色而不是黄色)-良好的对比度。我试过用GPUImageContrastFilter和GPUImageWhiteBalanceFilter。GPUImageWhiteBalanceFilter运行良好，但GPUImageWhi

浏览 0提问于2016-02-04得票数 0

1回答

段字符

、、

我面临着复杂背景下的字符分割问题。我已经尝试将图像分割成4个通道C，M，Y，K，但如果有人能提出一些想法，分割质量仍然很差，如果真的很好。这是我的源图

浏览 3提问于2016-04-17得票数 0

1回答

用Vision读取不同字体类型

、、、、

我正在尝试从这些图像中提取文本，但Google似乎无法识别大部分文本，有人能提出更好的替代方案吗？ Google OCR的结果

浏览 1提问于2018-04-17得票数 0

回答已采纳

1回答

如何在浮动中隐藏字符串希腊语格式

、、

我的问题是，我不能将一个字符串从一个Dataframe列转换为一个数字。该表包含希腊形式的数字。也就是说，在希腊形式中的数字21,88在英国或美国等于21.88。对我来说，小数是否会以希腊或英国-美国的格式声明并不重要。但我想让蟒蛇认出它们是漂浮的。如您在图像中所看到的，数字显示为数字，但当您选择单元格t时，撇号也会出现，但仅以数字表示字符串…。

浏览 3提问于2022-01-09得票数 0

回答已采纳