文章/答案/技术大牛

发布

Java: Tesseract-ocr:如何找到单词坐标？

Java: Tesseract-ocr是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，用于将图像中的文字转换为可编辑的文本。在使用Tesseract-ocr进行文字识别时，如果需要找到单词的坐标，可以通过以下步骤实现：

首先，使用Java的图像处理库（如OpenCV）加载待识别的图像，并将其转换为Tesseract-ocr可接受的格式（如灰度图像）。
创建一个Tesseract实例，并使用setPageSegMode方法设置识别模式为PSM.SINGLE_WORD，以便Tesseract将每个单词作为一个独立的文本块进行处理。
使用setLanguage方法设置识别语言，例如英文使用"eng"。
调用Tesseract实例的setTessVariable方法，设置tessedit_create_hocr参数为true，以便生成包含单词坐标信息的HOCR（HTML OCR）输出。
调用Tesseract实例的setImage方法，将待识别的图像传递给Tesseract。
调用Tesseract实例的getHOCRText方法，获取包含单词坐标信息的HOCR文本。
解析HOCR文本，提取出单词的坐标信息。

在实际应用中，Tesseract-ocr可以用于各种场景，如扫描文档的文字提取、图像中的文字识别等。对于Tesseract-ocr的使用，腾讯云提供了OCR相关的产品和服务，例如腾讯云OCR文字识别服务（https://cloud.tencent.com/product/ocr）可以帮助开发者快速集成OCR功能，实现文字识别的需求。

请注意，以上答案仅供参考，具体实现方式可能因应用场景和需求而有所差异。

Java: Tesseract-ocr:如何找到单词坐标？

、

最近，我成功地使用Tesseract-ocr将PNG文件转换为文本。我使用的是Java。场景:我正在拍摄移动应用程序的屏幕截图( PNG )，并使用Tesseract将PNG文件转换为文本。问:当我将PNG文件转换为文本时，我是否也可以在手机屏幕上获得某个文本元素的坐标(X，Y)？示例:在将PNG文件转换为文本时，文本显示为“通过添加自述文件，帮助对此存储库感兴趣的人了解您的项目”。在上面的例子中，我能得到文本元素"understand“的坐标(X，Y)吗？

浏览 39提问于2019-02-07得票数 0

回答已采纳

1回答

Pytesseract OCR边界框

、、

有没有办法获得每个完整单词的边界框？但它返回每个字母的边界框，所以我想知道是否有人可以推荐一种替代方法，或者他们是否知道python中的替代ocr包可以使用我的xml文件来查找边界框和其中的ocr (或者他们是否知道pytesseract如何做到这一点int(b[2])), (int(b[3]), h - int(b[4])), (0, 255, 0), 2) 我期望代码只返回我创建的标签中出现的相关内容，我可以执行重叠检查的代码，但我只需要每个单词完成边界框

浏览 5提问于2019-01-13得票数 0

1回答

用于培训的Tesseract TessData字体

、

在Android应用程序中，我正在使用用于OCR的tesseract。我专注于中文，但我只需要识别几个关键词，所以我想用jTessBoxEditor创建我的jTessBoxEditor文件。我想知道中国传统的TessData文件使用哪些字体？

浏览 16提问于2017-04-06得票数 1

回答已采纳

1回答

使用tesseract在图片中的单词周围画一个矩形

、、

我想知道如何在我的c++应用程序中使用tesseract-ocr在段落图片中绘制单词周围的矩形。此外，我还想从图片中裁剪一些单词！有什么想法吗？

浏览 2提问于2012-11-20得票数 0

回答已采纳

1回答

Java/Tesseract-OCR:不满意的LinkError libtesseract302

、、、、

我正在将一个同事Tesseract-OCR应用程序从MacOSX迁移到Windows 64，并遇到了库路径问题。当我执行OCR进程时，我得到以下信息：我搜索了安装文件夹，只在下面的路径中找到一个libtesseract302.rc文件，而且我不认为它是正确的文件。C:\Program Files (x86)\

浏览 3提问于2013-10-07得票数 0

回答已采纳

1回答

字符/单词的坐标[OCR应用程序]

、、、

因此，基本上，我正在创建一个android应用程序(使用tesseract和OpenCV)，当经过预处理和扫描步骤给出一个单词时，在这个单词周围画一个矩形--基本上是“找到”这个单词并标记它。然而，我想知道如何获得一个字符的坐标？或者至少一个字？我有每一行的坐标，但是坐标不是相对于“主图片”的，而只是我所拥有的“文本块”的坐标。也许有人已经/知道如何找到单词/字

浏览 2提问于2018-05-22得票数 0

回答已采纳

1回答

单词搜索程序(Python)

我正在开发一个单词搜索程序，它读取一个文件，并将文件中给定数量的字符串转换为一个单词搜索板，旁边是要搜索的单词列表。我的程序大部分都在工作，但是我不确定如何找到我列表中单词的结束位置。我的代码：我正在使用的给定文件：为了澄清，我的程序能够通过坐标找到每个给定的单词及其开始位置，但是，我也希望能够找到每个单词的结束/最后一个坐标。除此之外，我还想按字母顺序打印出每个<e

浏览 28提问于2017-12-12得票数 0

1回答

打开数据文件时出错。/eng.traeddata

、

#### Java VM: Java HotSpot(TM) 64-B

浏览 1提问于2020-11-07得票数 0

1回答

如何提高来自Tesseract的OCR文本的准确性？

、、、、

此外，当它试图扫描图像中超过四个单词时，应用程序会崩溃。我是否需要使用不同的数据结构来保存已识别的文本，或者是否有其他原因导致四个以上的单词无法识别？

浏览 2提问于2012-07-03得票数 3

回答已采纳

1回答

如何将Tesseract OCR库集成到C++程序中

、、、、

我还没有找到任何关于如何将Tesseract库包含到C++文件中的示例。类似于：我在Ubuntu 10.10上使用的是Tesseract v3.00。

浏览 0提问于2012-02-06得票数 6

回答已采纳

1回答

获取JavaScript文件中特定字符串的坐标

、、

有没有JavaScript解决方案可以让我获得文件中特定字符串的x和y坐标以及宽度和高度？PDF.JS可以从PDF文件中提取文本块，并给出x和y坐标以及这些块的宽度和高度。但我对这些文本块如何组合在一起没有任何影响(从单个字符到更大的几个单词)，我也不知道如何处理这样的块的各个部分的坐标。这意味着如果PDF文件包含"Hello world!"在Java语言中，PDFBox允许这样做(参见How to search some specific str

浏览 109提问于2021-06-28得票数 0

1回答

在图像中查找已知文本(引导OCR)

、

我理解这通常是如何做到的: OCR页面，保留文本的位置，然后将文本作为不可见层添加到PDF中。我如何利用现有的软件来做到这一点？编辑:文字的大小和字体各不相同，尽管段落是一致的。

浏览 3提问于2015-02-23得票数 4

1回答

如何在Word或Txt类型的文件中读取字符串的X和Y坐标？

、、

找到搜索到的字符串后，我希望获得它在文档中的位置(X和Y坐标)，至少是搜索到的字符串的前几个字符。我可以使用java.util.scanner搜索字符串。

浏览 0提问于2014-03-14得票数 1

2回答

在匹配一行之后，如何读取更多的行和记录值，然后重新开始？Python

、、、、

我想知道如何搜索文本文档中的单词POLYLINE，一旦我找到它，如何继续搜索文本文档中的POLYLINE的更多属性，比如x坐标和y坐标，然后找到下一个POLYLINE，然后再做一次。到目前为止，我所做的所有代码都是找到单词POLYLINE，我只能尝试收集POLYLINE的属性。

浏览 1提问于2012-02-09得票数 0

回答已采纳

4回答

Tess4J -本机库(Linux8664/libtesseract.so)在资源路径中找不到

、、、

更新-java.lang.UnsatisfiedLinkError: Unable to load library 'tesseract': Native library

浏览 12提问于2014-10-26得票数 5

1回答

如何获取PDF中每个单词的坐标？

、、

对于每个单词，我创建一个LocationTextExtractionStrategy类的对象来获取它的坐标，但问题是每次我传递一个单词时，它都返回这个单词的所有块的坐标。我如何才能得到在特定位置或在特定行中的单词的坐标？我在某个地方找到了一个密码 { { public iTextSharp.text.Rectan

浏览 3提问于2017-09-26得票数 0

4回答

pytesseract错误Windows错误[错误2]

、、、

请找到代码：from pytesseract import image_to_stringstartupinfo)我没有找到一个具体的解决方案

浏览 4提问于2017-01-15得票数 3

1回答

OCR只返回图像中几个字的大小

、、

是否有任何OCR工具只读取图像中某些单词的坐标()。例如，参考附件图像，我只需要两个单词的坐标，即1)“测量”2) "999999.9mi“ 这能实现吗？我可以考虑将所需的单词作为输入输入到任何OCR工具，如Tessnet2，但没有找到任何合适的功能？任何其他建议都会有帮助。

浏览 4提问于2015-07-08得票数 1

2回答

如何用文本绘制图上的点(python)

、、

我试着复制这个：我有一个单词列表，每个单词都有一个x和y坐标。我要和上面的画一样。做这件事最好的方法是什么？我知道我可以做一些像..。对于每个单词，我有一个函数来传递它来找到x坐标，然后另一个函数找到它的y坐标。也许仅仅是一个单词的列表，然后是一个循环的函数，在每个单词遍历列表的过程中画出每一个的图？这个是可能的吗？

浏览 6提问于2020-08-04得票数 0

回答已采纳

1回答

在Java中将坐标从React转换为iText

、、

我有一个react应用程序，它使用mozilla的pdf.js来突出显示一个单词或句子，并向突出显示的部分添加评论。他们正在将高亮显示部分的坐标发送到java服务中。在Java端，我们需要使用iText进行实际的高亮显示，并将注释添加到pdf中。这里的问题是，在pdf.js中，坐标是从屏幕的左上角开始计算的(即，0,0从屏幕的左上角开始)，而在iText中，坐标是从屏幕的左下角开始计算的。那么，谁能告诉我如何将pdf.js给出的坐标映射到iText<

浏览 10提问于2018-07-26得票数 0

点击加载更多