ocr提取 - 腾讯云开发者社区

、、

我让Tika在PDF文件上使用Tesseract，但是如果我给它一个同时具有可搜索文本和图像的PDF文件，文本是OCRed两次。有什么办法可以避免这种情况吗？即使它要经过两次，一次是笔直的文本，另一次是图像。

浏览 4提问于2020-12-31得票数 1

回答已采纳

2回答

以编程方式从图像中提取文本

、、

我需要先下载图像，然后从其中提取文本。有没有什么程序化的方法可以做到这一点？

浏览 1提问于2011-03-21得票数 1

回答已采纳

1回答

我们可以使用Selenium从图像中获取文本吗？

、、、

这是图像的路径，为了安全起见，我必须将显示在图像上的文本输入到文本中， private WebElement textShown;@FindBy(id = "metric_iframe")我试图使用textShow

浏览 0提问于2023-03-05得票数 -1

回答已采纳

1回答

在openimaj中是否有OCRProcessor的具体实现？

、

我试图使用openimaj进行文本提取，并使用LiuSamarabanduTextExtractorBasic文本提取器子类。但是这个类需要一个OCRProcessor实现来完成实际的OCR。下面是javadoc对于提取以与文本区域的文本表示相关联的文本区域，必须使用OCR处理器。使用此函数可选择用于提取读取文本区域的OCR处理器。我没有在

浏览 4提问于2015-04-26得票数 1

回答已采纳

1回答

从pdf图像文件中提取文本

、、、

我有一个图像文件，我想从给定的图像中提取文本，我尝试了各种OCR引擎，但我无法找到左侧实体和右侧实体之间的关系，因为OCR引擎只是提取没有实体之间关系的文本。例如事务(公司借款)，account#1: Cash account#2: Loan payable 我尝试过使用各种OCR引擎和PyPDF2和pdftotext进行文本提取。

浏览 1提问于2019-08-27得票数 2

1回答

执行OCR时出错- Microsoft Azure Computer Vision API

、

我正在使用Microsoft Azure Computer Vision进行OCR PDF提取。当我尝试执行OCR时，它给出的错误为 Read PDF With OCR: Error performing OCR: MicrosoftAzureComputerVisionErrorRunEngine

浏览 31提问于2020-07-01得票数 0

1回答

使用python从PDF中提取扫描页面

、

我想要执行OCR并从这些文件中提取文本。我尝试过pytesseract，但它不直接对pdf文件执行OCR，因此，作为一项工作，我希望从PDF文件中提取images，将它们保存在目录中，然后直接在这些图像上使用pytesseract执行OCR。在python中有没有从pdf文件中提取扫描图像的方法？或者有任何方法可以直接对pdf文件执行OCR？

浏览 1提问于2018-05-26得票数 0

回答已采纳

1回答

AWS对响应的文本块数量的限制？

、、

尝试使用AWS执行DetectText，基本上是为OCR尝试，我只看到响应中包含了大约30%的文本，其余的文本被忽略了。有人知道在响应中返回的文本块总数有限制吗？有办法绕开吗？

浏览 2提问于2018-06-12得票数 1

回答已采纳

1回答

我有一个任务，在那里，我必须提取文本，是背后的图像，并已从图像本身OCR编辑。这一案文是透明的。问题是，有一个图像，它的背后有文字，不是OCR编辑的，它只是正常的文本，它是不透明的。这是一个具有代表性的pdf文件：图像OCR文本应该在第2页、第3页、第12页上提取，而文本也在第4页上提取。在第4页，图像后面没有OCR文本，但是图像下面有规则文本。我需要过滤掉它，因为我只需要OCR文本。

浏览 6提问于2021-07-13得票数 0

回答已采纳

1回答

如何对中较大句子的一部分块进行分组？

、

我正在使用Google Cloud Vision API on Python来检测囤积板中通常在商店/商店上面发现的文本值。到目前为止，我已经能够检测到单个单词及其包围多边形的坐标。是否有方法根据检测到的单词的相对位置和大小对其进行分组？如果API没有提供这样的函数，那么对它们进行分组的好方法是什么？以下是我迄今为止所做的一幅图片的例子：description: "SHOP"

浏览 1提问于2018-09-18得票数 0

回答已采纳

1回答

HowTo从PDF中提取嵌入的光学字符识别数据？

、、、

我有嵌入OCR数据的PDF文件。(所以我已经对它们进行了orcd )，所以它们是可搜索的。现在我想提取这个OCR数据，因为我想放入我的tomcat6搜索服务器。为此，我需要普通的OCR数据。所以我的问题是，有没有可能从pdf文件中提取嵌入的OCR数据？如果能得到带有坐标的文件就好了。但它也足以获得纯文本文件。

浏览 2提问于2011-03-02得票数 2

2回答