从图像中提取文本

是一种计算机视觉领域的技术，也被称为光学字符识别（Optical Character Recognition，OCR）。它的主要目标是将图像中的文字转换为可编辑和可搜索的文本数据。

图像中提取文本的过程通常包括以下步骤：

图像预处理：对图像进行预处理，包括灰度化、二值化、去噪等操作，以提高后续文字识别的准确性。
文字定位：通过检测图像中的文字区域，确定文字的位置和边界框。
文字分割：将文字区域中的字符分割成单个字符，以便后续的字符识别。
字符识别：使用OCR算法对每个字符进行识别，将其转换为可识别的文本。
后处理：对识别结果进行后处理，包括字符校正、识别错误修正等，以提高识别准确性。

图像中提取文本的应用场景非常广泛，包括但不限于以下几个方面：

文字识别：将印刷体文字转换为可编辑和可搜索的文本，方便文档的编辑、检索和分析。
车牌识别：通过提取图像中的车牌号码，实现车辆的自动识别和管理。
手写体识别：将手写文字转换为可编辑和可搜索的文本，方便手写笔记的整理和检索。
文字翻译：通过提取图像中的文字，并使用机器翻译技术将其翻译成其他语言。
图像标注：将图像中的文字提取出来，用于图像的标注和描述。

腾讯云提供了一系列与图像文字识别相关的产品和服务，包括：

通用印刷体识别（OCR）：提供高精度的印刷体文字识别服务，支持身份证、银行卡、营业执照等多种类型的证件识别。
手写体识别（OCR）：支持将手写体文字转换为可编辑和可搜索的文本，适用于手写笔记、信件等场景。
车牌识别（OCR）：实现车牌号码的自动识别和管理，适用于停车场管理、交通违法处理等场景。
图片标签识别：通过提取图像中的文字，为图像添加标签和描述，方便图像的管理和检索。
图片翻译：将图像中的文字提取出来，并使用机器翻译技术将其翻译成其他语言。

更多关于腾讯云图像文字识别产品的详细信息，您可以访问腾讯云官方网站的相关页面：腾讯云图像文字识别。

无法从特定PDF中提取文本和图像

、、、、

有谁能让我知道如何从PDF中提取所有文本和图像？在类似的场景中，我能够提取图像，我使用Google创建了一个PDF，只有几行文本和2个png图像。但是，我无法从样本中提取图像。我试过以下几点：在Ruby中： 1)“pdf阅读器”创业板，它只支持少数格式的图像提取。 2)“文档分割”创业板，它只能提取文本，不能提取图像。命令行实用程序： 1) "pdfimages“工具，它只支持少数格式的图像提取。 Java库： 1) pdfbox库，它只支持少数格式的图像提取。

浏览 0提问于2015-05-20得票数 2

回答已采纳

1回答

azure计算机视觉检测文本

我正在使用azure计算机视觉从图像中提取文本，它按预期工作，但现在我面临着一个挑战，我必须从图像中检索特定的文本，而不是从图像中检索所有文本，并且我想要提取的文本可能在不同的图像中不同。(也许这些图像可以有一个共同的文本) Azure计算机视觉有什么方法可以帮助我做到这一点吗？示例:配料因为有很多照片，配料与简单的文本混合在一起，我如何才能只提取配料： ? 谢谢

浏览 67提问于2021-11-19得票数 1

回答已采纳

1回答

提取PDF中表示为图像的文本- itextsharp

、、、

我在使用ITextSharp从PDF文件中提取文本的过程中，我已经成功地提取了我感兴趣的文本的一部分，但当我继续我的‘文本’提取时，我注意到一些文本单词(当我使用itextsharp从整个页面提取整个文本时无法获得文本)实际上被表示为图像。Adobe Reader已经向我确认了这一点。因此，简而言之:如何提取包含在PDF图像对象中的文本？我是否必须提取图像并找到另一种方法将其转换为文本？这是一个非常可怕的行星排列对我来说..有人遇到过这个问题吗？

浏览 4提问于2013-06-07得票数 2

回答已采纳

1回答

如何从pdf文件的图像中提取文本？

我在python应用程序中使用tika从文档中提取文本。一切正常，但它不是从pdf文件中提取的图像。Tika可以从pdf和图像中提取文本，但不能从包含图像的pdf中提取文本。我有点困惑。有没有办法做到这一点？是否需要将PDF文件转换为图像？

浏览 3提问于2018-10-11得票数 1

1回答

从图像中获取手写文本

、、、

如何在Java中从图像中提取手写文本，如银行表单图像？我尝试使用Tesseract，OCR，GOCR，但对我不起作用。在Java中，有没有其他方法可以从图像中提取手写文本，其工作效率至少为80-90%？

浏览 17提问于2017-05-30得票数 1

1回答

如何在OpenCV - JAVA中设置感兴趣区域

、、、

我有一张名片的图像，为了从图像中仅提取名片，我对其执行了透视变换。现在，我希望将此图像提供给tesseract-ocr引擎。在此之前，我希望提取包含一些文本的感兴趣区域，并提供该区域，而不是整个图像。如何从卡片中仅提取文本。以下是该图像的示例：

浏览 1提问于2014-11-08得票数 1

2回答

使用Perl从PDF中提取图像/文本

、、

我正在尝试使用Perl从PDF文件中提取文本/图像/表格。我尝试使用，它不是以文本形式提取的，而是以其他格式提取的。有没有一种方法可以使用Perl模块从PDF中提取文本/图像/表格？

浏览 0提问于2016-04-27得票数 2

1回答

是否有使用云视觉api提取图像字体属性的功能？

、、、

文本提取用于从图像中提取文本。我们是否可以使用文本提取功能从给定的图像中提取字体系列、字体样式、字体大小等图像字体属性()？预期将提取以下功能字体-家庭： TimeNewRoman 字体尺寸： 18 字体-颜色：黑色

浏览 3提问于2019-08-22得票数 2

1回答

图像到文本转换python

、、

我正在尝试使用python中的pytesseract模块从图像中仅提取突出显示的文本。问题是我无法提取突出显示的部分，整个图像正在转换为文本，我不知道如何提取基于背景颜色的特定部分。

浏览 11提问于2020-05-12得票数 0

1回答

谷歌的移动视觉支持英语以外的其他语言吗？

、

我使用Google的vision API从我的android应用程序中的任何给定图像中提取文本(仅为英文)。该应用程序在安装时只需一次在线获取所需的所有库，然后就可以从图像中提取英文文本，而不需要互联网。除了英语以外，其他语言也能达到同样的效果吗？最近，我了解了谷歌的云视觉API，它确实支持不同的语言，但每次你想扫描图像时，它都需要互联网。因此，准确地说，我只想知道是否可以从图像中提取任何其他语言的文本，只需在应用程序依赖项中添加这一行，如果是，那么如何提取呢？ compile 'com.google.android.gms:play-services-vision:10.0.1

浏览 1提问于2017-02-14得票数 0

回答已采纳

3回答

从PDF中提取具有坐标和大小的图像和单词

、、、、

我读过很多关于PDF提取和库(如iText)的文章，但我还没有找到从PDF中提取图像和文本(带有坐标)的解决方案。任务是用产品目录扫描PDF并提取每幅图像。在每个图像旁边打印一个图像代码，以及在图像上显示的产品的产品代码列表。我知道没有办法从像这样的PDF中提取结构化的信息，但是使用所有图像和文本对象的坐标，我可以编写代码来根据链接文本与图像的距离来识别链接的文本。然后我可以使用RegExp来分割文本，找出什么是产品代码，什么是图像代码等等。你能为这项工作推荐一个好的解决方案吗？

浏览 0提问于2011-11-23得票数 8

1回答

使用pdfbox，为什么可以提取文本，但不能提取图像

、、

我正在使用pdfbox从这个中提取图像和文本。我有以下提取文本的代码： PDFTextStripper p = new PDFTextStripper(); String thistext=p.getText(document); 它可以正确地提取文本。但是，当我尝试使用ExtractImages类从相同的pdf中提取图像时，生成的图像是pdf的所有页面，而不是实际的图像。这是因为pdf可能是扫描副本的原因吗？如果这是真的，为什么文本会被提取出来？

浏览 4提问于2013-01-31得票数 0

1回答

使用selenium从网站保存图像

、

我正在测试web应用程序，它可以帮助使用光学字符识别从图像中提取文本。解释的步骤是使用“将文本转换为图像实用程序”在图像中输入要转换的文本。现在我们已经开发了OCR应用程序来从图像中提取这个文本。我想保存这个图像，并将它传递给OCR应用程序，这是基于web的应用程序。所以我想知道如何保存这个文本图像来驱动示例：

浏览 0提问于2012-12-27得票数 1

1回答

从pdf文件中提取文本和包含文本的图像

、、

我正在从pdf文件中提取文本，该文件具有行文本和一些具有文本的图像报告。我应该使用哪种OCR技术来提取行文本和图像中的文本。我已经尝试了一些OCR技术，要么是做OCR，要么是从pdf中读取文本。我需要一次完成这两个任务。谢谢。

浏览 14提问于2019-07-19得票数 0

1回答

EasyOCR无法识别框中的字符

、、

我使用easyocr从图像中提取文本。我能够正确地提取细节，但是，即使图像是清晰的，Easyocr也无法正确提取图像的一部分。附件是未正确提取的图像部分。在所示的图像中，一些字符被提取出来，一些字符被提取出来，本例中只提取了S190。有人可以帮助我如何提取这个数字，因为它正在使用easyocr。

浏览 48提问于2021-06-08得票数 0

2回答

当使用iTextSharp从PDF文件中提取文本时，我得到这个错误：“找不到图像数据或EI”

、

当使用iTextSharp从PDF文件中提取文本时，我得到这个错误：“找不到图像数据或EI” 此错误发生在仅包含图像的特定页面上。原因可能是因为我试图提取文本，而不检查页面中是否有任何文本内容？

浏览 1提问于2013-12-05得票数 0

1回答

基于AWS推理的视频文本提取

、、、、

我项目的一个目标是使用AWS从流视频中检测文本。我一直在搜索AWS的文件。看起来，AWS允许开发人员从存储的图像中提取文本，只从中提取。参见这个AWS文档-- ，AWS文档提供了以下代码来检测图像中的文本。这段代码基本上有detect_text API，它从S3获取存储的图像作为输入，并从图像输出检测到的文本。我的问题是--有什么方法可以用AWs推理从流媒体视频中提取文本吗？或者我是否可以说，目前无法使用AWS Rekognition从流视频中提取文本？让我知道实现这一目标的任何方法。 import boto3 if __name__ == "__main__":

浏览 0提问于2019-08-04得票数 1

回答已采纳

1回答

图像是否包含文字，如何分类？

、、、

我从搜索引擎中提取了很多图像，我使用OCR从这些图像中进行下降文本提取，但是有些图像不包含文本。因此，我想确定一个图像是否仅仅包含了python中的文本，如果没有，我就不必在它上执行OCR了。理想情况下，这种方法会有很高的召回率。

浏览 4提问于2022-08-06得票数 0

回答已采纳

1回答

从qtp中指定的坐标中获取文本

在qtp中是否有一个函数可以指定要考虑的坐标，并从坐标中提取文本。例如，我只想要图像中特定部分的文本，所以有没有一个函数，在其中我可以给出坐标，并且文本只在坐标内从图像中提取出来。谢谢

浏览 0提问于2011-10-31得票数 2

回答已采纳

2回答

从图像中提取文本

、、

我有一个图像，我正在使用aspire和Aspose api的图像提取，但输出得到空白没有从图像.after，我可以使用test4j，但输出没有得到任何东西，但输出没有得到任何东西，我如何从我的图像提取文本在我的图像显示bellow.that图像是手绘从安卓手机！我的形象：请建议我如何提取文本或我可以使用哪些OCR属性，提前谢谢

浏览 0提问于2014-06-10得票数 3

1回答

如何提取不是图像的图形

、

的第一页在图像顶部显示以下白色修饰文本。在使用时，该图形是而不是提取为图像，只提取背景图像，没有白色修饰文本。当转换为Word文档时，修饰文本被提取为形状，可以修改属性，例如填充颜色、边框颜色等等。是否可以使用PDFBox从PDF中提取该形状？多么?

浏览 8提问于2021-12-19得票数 0

1回答

使用什么库从图像中提取文本(OCR)？

、

我需要识别图像中的文本(OCR)。我可以在Python中使用什么库从图像中提取文本？

浏览 1提问于2011-08-03得票数 7

回答已采纳

2回答

如何在iOS中检测和提取图像中的文本位置

、、、

如何从图像中检测和提取文本的位置。例如，文本" pepsi“来自百事可乐瓶子图像。

浏览 2提问于2014-10-06得票数 0

1回答

不能使用pyTesseract读取文本

、、

我试图从PDF中提取徽标。我正在应用GaussianBlur，找到轮廓和只提取图像。但是Tesseract不能从那个图像中读取文本吗？

浏览 1提问于2018-06-13得票数 0

1回答

在Objective C中从HTML中提取图像路径

救命！我是iPhone应用程序开发的新手，我正忙于语法分析！我试图从以.cms结尾的网址中读取提要，我能够从源中获得文本，并使用flattenHTML代码删除超文本标记语言，但我在提取图像的路径时遇到了问题。图像的路径类似于：....(text+html)...><img src="。如果有人可以帮助并建议我如何获取提取的图像的路径...：( 提前感谢！

浏览 1提问于2010-07-29得票数 0

1回答

将image标签中的image src转换为string变量

我有一些html文本，它有时包含一个图像，例如 <img src="imagename.jpg" alt="something" /> 我知道如何从文本中删除整个图像标记，但我希望从文本中提取图像SRC (并将其存储在DB中)。每段文本中只有一幅图像，因此只需将src视为字符串变量。有人知道这是怎么做到的吗？谢谢,

浏览 0提问于2013-06-25得票数 0

1回答

适用于.net的免费OCR SDK，可将文本、表格和图像提取到Office word文档中

、、

我想有一个免费的OCR SDK，可以提取文本，表格与数据和图像从扫描的文件(.tiff，.png等)，并存储到Office Word文档文件。请帮我把这个问题删掉。我已经做了提取文本只从图像使用莫迪，但不能得到的方式使用莫迪如何提取表格和图像，并存储到Office Word文档文件。

浏览 5提问于2011-08-12得票数 3

1回答

OHow我能用python从图像的特定区域提取文本吗？

、

我试图从图像中提取文本，但是在图像的某个区域内，而不是整个图像。我已经能够检测到感兴趣的对象的位置并获得它们的坐标。虽然我不知道从特定区域提取文本时从哪里开始。我使用这个示例中的代码：它能够检测圆圈，但我想更进一步，从圆圈中提取数字，并将它们标记到相应的坐标。我正在使用这个例子来学习如何自己做类似的事情，但我真的更感兴趣的是决定在一个设定的区域内进行搜索。

浏览 14提问于2019-08-19得票数 0

1回答

如何利用iText apis提取PDF水印内容

、

我正在浏览itext文档&我能够创建一个包含水印图像或文本的pdf，但没有找到从pdf中获取/提取水印内容的方法。因此，我有一个pdf文档，包含有水印的文本/图像&我想提取该文本或img，并验证这是我无法做到的。如何使用iText apis提取水印内容？或者是否有其他方法来验证水印内容？通过验证我的意思是，如果我有一个现有的pdf/图像与一些水印文本，如在上面的参考文献第二链接，我想检查它是否期望文本/图像。参考文献：

浏览 6提问于2014-02-06得票数 1

1回答

从图像中提取文本- OCR

、、、、

这是我第一次使用OCR。我有一个图像，并希望从图像中提取数据。我的形象是这样的： 📷 我想提取参数和对它们的值。有人能指导我怎么做吗？我知道，如果图像包含一些简单的文本，我们可以使用tesseract和PIL库从图像中提取文本。在有多个参数的情况下，该怎么办？

浏览 0提问于2019-06-08得票数 1

1回答

Google Vision API -我们是否可以在检测文档文本时包含自定义预处理逻辑，并将其直接用作Vision API

、、

我正在使用Google Vision API从我的图像中获得所有的文本。但是，我只想通过调整图像的大小来提取图像上特定区域的文本，而不是整个文本。然而，对于所有图像，该区域并不定义为固定坐标；图像是错误的屏幕截图，其中消息可能在任何一侧，有时屏幕截图是通过在监视器上打开多个窗口来拍摄的。我想使用自定义逻辑首先处理图像，以识别可能出现错误消息的部分，并仅分割该部分，然后传递图像的该部分以进行文本提取。然而，我不希望在Vision API之外有任何预处理逻辑。有没有一种方法可以让我们在Vision API框架中包含额外的预处理逻辑，并获得一个可以同时执行预处理和文本提取的api？

浏览 21提问于2020-04-28得票数 0

1回答

有没有办法避免不必要的文本从车牌？

、、、

我是刚开始车牌识别的。我使用Goggle的视觉API(OCR)从图像中提取文本。但是这会从车牌上提取出所有的文本。例如，考虑下面的图像我只需要得到牌照号码6TRJ 244，但我可以从车牌上得到所有像california AUF 2012dmv.ca.gov这样的文本。有人能指导我如何避免其他文本而只提取许可证号码吗？请分享任何其他方法的车牌识别，我也可以尝试。谢谢

浏览 6提问于2020-06-14得票数 0

1回答

如何提高Tesseract的效果

、、、、

我希望在使用OpenCV和tesseract时检测图像中的文本。我的步骤是：为了检测文本，我使用了cv::text的场景文本检测算法。这实际上很好，在困难的情况下也是如此。分别从主图像中提取包含文本的图像区域。我把每个子图像传递给Tesseract 然而，tesseract几乎没有找到文本，如果它找到文本，则它是错误的。示例：(从获取的图像) Green:通过OpenCV检测到文本(很好)。黄色：：基于绿色矩形的tesseract识别的文本(坏) 提取的文本为"DOUBLEI“。“I”是右边黑色边框的结果。正如您所看到的，其他单词，如“禁止”，也

浏览 3提问于2017-03-02得票数 3

1回答

Python:在google中删除竖线和水平线

、、

我试图从以下几个方面提取手写文本：使用在不使用任何第三方技术的情况下，谷歌视觉API中是否有任何选项可以在提取文本之前从图像中删除垂直线和水平线？

浏览 0提问于2019-07-08得票数 0

回答已采纳

3回答

从图像中提取线条以馈送到OCR - Tesseract

、、

我在15:33左右观看了pycon 的演讲，演讲者谈到了从图像(收据)中提取线条，然后将其提供给OCR引擎，以便以更好的方式提取文本。我也有类似的需求，我需要将图像传递给OCR引擎。然而，我不太明白他从图像中提取线条是什么意思。我可以使用哪些开源工具从图像中提取线条？

浏览 4提问于2013-03-28得票数 5

1回答

用OpenCV从直线中提取点

、

我正试图用openCV语言从图像上的一条线中提取点。这条线被编程以显示在图像上，但我需要知道如何从行中提取点并输入到文本文件中？

浏览 0提问于2015-06-15得票数 0

回答已采纳

2回答

从.pptx的幻灯片中提取图像

、、、、

我可以用任何程序从.pptx的幻灯片中提取图像和文本，然后将其放到数据库中吗？我尝试手动将.pptx转换为.rar，并使用一些代码从每个slide.xml (在<a:t></a:t>标记之间)提取文本，并检测是否有图像，以及是否从ppt\media文件夹获取下一个图像，但我不知道图片的标记是什么。我还查看了C#的Interop，但是找不到只给我图像和文本的东西。只有整张幻灯片就像截图。 pptPresentation.Slides[1].Export("c:\\temp\\slide.png", "png", 320, 240);

浏览 2提问于2016-02-02得票数 1

回答已采纳

1回答

如何从Linux命令行中从“读取保护”PDF中提取所有图像？

、、、、

我正在尝试从PDF中提取图像，PDF是受保护的。对于普通的PDF，可以很好地提取图像，而从受阅读保护的PDF中也可以很好地提取文本。然而，这些图片却是另一个故事。它既不提取所有图像，也不以模糊的灰色或黑色提取所有图像。在下面的PDF ()中，您可以在下面的缩略图中看到很多图像：我尝试了来自pdfimages的命令 $ pdfimages -j ticket.pdf i 和来自的命令 $ pdftohtml -nodrm ticket.pdf 但这两张照片都只提取了其中的一幅。但是，该图像被正确提取。从其他PDF，我得到所有的图像，但他们都是灰色或黑色。因为据推测，读保护只是P

浏览 1提问于2015-04-30得票数 1

3回答

php中的pdf文本提取器类

、、

有没有任何可用的类，在php中提取所有的文本从pdf文件，以便我可以存储在mysql数据库中。我的pdf有许多元素，如图像，表格，纯文本，表单元素，图表等。到目前为止，我在过去的两天里看到了许多提取文本的类，但没有一个促进完整的文本提取，不是从pdf中提取完整的文本。我想从给定的pdf文件中提取所有文本，即使文本在表中等。有人知道这事吗？:) 非常感谢。祝您有愉快的一天:)

浏览 1提问于2011-06-29得票数 2

回答已采纳

1回答

在使用iTextSharp从PDF文件中提取文本时，我得到了以下错误：“无法找到图像数据或EI”。

、

在使用下面的代码从iTextSharp文件中提取文本时，我得到了以下错误：“无法找到图像数据或EI”，调试时发现此错误出现在某些页面但并非所有页面中，然后进一步研究并发现在PDF xObject图像和内联图像中通常有两种类型的图像，使用下面的代码内联图像无法处理。在其他类似的文章中，很少有评论建议使用最新版本(5.5.0) itextsharp，我也这么做了，但没有运气。我的基本目的是提取页面中的文本，而不是图像。如何处理内联图像，或者如何仅提取文本，而不管页面具有何种类型的图像。 for (int page = 1; page <= pdfReader.NumberOfPages; p

浏览 1提问于2014-05-11得票数 0

1回答

Tesserocr与Pytesseract速度比较

、、、

从我在网上收集到的内容来看，当尝试从python中的多个图像中提取文本时，使用tesserocr库应该比使用pytesseract更快，因为它不必每次都启动tesseract框架，它只是进行预测。但是，我实现了两个功能，如下所示： api = tesserocr.PyTessBaseAPI() # tessserocr function def tessserocr_extract(p): api.SetImageFile(p) text = api.GetUTF8Text() return text # pytesseract function def pytess

浏览 7提问于2022-10-10得票数 0

2回答

从图像中提取文本

、、、、

我的工作是从图像中提取文本。最初，图像是用白色的文本着色的，在进一步处理图像时，文本显示为黑色，其他像素为白色(带有一些噪声)，以下是一个示例：现在，当我使用pytesseract (tesseract)尝试OCR时，仍然得不到任何文本。有没有可能从彩色图像中提取文本的解决方案？

浏览 0提问于2017-09-17得票数 5

1回答

从图像中提取文本

、

从图像中提取文本 public class Test1 { public static void main(String[] args)throws Exception { BufferedImage image = ImageIO.read(new File("D:\\Test2.jpg")); String s = new OCR().recognizeCharacters(image); System.out.println("RESULTS: \n"+ s); } }

浏览 0提问于2013-10-11得票数 1

回答已采纳

1回答

从PDF文件中提取稀疏图形？

、、

我一直致力于从文本文件中提取图像。它适用于密度较高的图像，如。但是，使用诸如PyMuPDF Pillow之类的库，我无法提取诸如之类的稀疏图像。我尝试过一些表格提取工具，如'tabula'，'camelot‘，但这些工具最适合在表格中组织数据。

浏览 3提问于2021-05-31得票数 1

1回答

PDFBox :在提取文本时维护PDF结构

、

我正在尝试从PDF中提取文本，PDF中充满了表格。在某些情况下，列是空的。当我从PDF中提取文本时，emptys列会被跳过并替换为空格，因此，我的正则表达式无法确定在这个位置有一个没有信息的列。更好地理解图像：我们可以看到，在提取的文本中，列并不受尊重。从PDF中提取文本的代码示例： PDFTextStripper reader = new PDFTextStripper(); reader.setSortByPosition(true); reader.setStartPage(page); reader

浏览 2提问于2017-08-23得票数 3

回答已采纳

1回答

在pytyon中，是否有可能在删除图像中的线条时防止文本的像素？

、、

我在table.But中处理文本提取过程，同时移除影响文本的pixel.is的表格行，这样就可以保持文本像素在表行像素上的覆盖。原始图像为RGB 此图像是从原始图像中裁剪出来的，以供参考。输出区域

浏览 0提问于2020-05-06得票数 0

1回答

如何使用openCV或OCR技术从图像中提取文本？

、、、、

可能重复：我目前正在做一个基于android手机图像捕捉的文本识别项目。我想问如何从图像中提取文本？是否有任何openCV或OCR教程用于提取？

浏览 1提问于2012-05-16得票数 3

1回答

将文本搜索添加到基于内容的图像检索(convnet)

、、、、

我使用标准的ConvNet方法实现了CBIR应用程序：利用传输学习从图像数据集中提取特征基于knn的聚类特征提取给定搜索图像，提取其特征。给出与knn网络中的图像接近的前10幅图像。我得到了很好的结果，但我希望通过添加文本搜索来进一步改进它们。例如，当我的图像是汽车的方向盘时，接近的结果将是任何类似方向盘的圆形物体，例如自行车轮。输入文本的最佳方法是“汽车部件”，只生产与搜索图像类似的方向盘。我无法找到一种将ConvNet与文本搜索模型相结合的方法来构建改进的knn网络。我的另一个想法是使用ElasticSearch来进行文本搜索，这是ElasticSea

浏览 0提问于2019-01-23得票数 1

1回答

预处理图像后检测白文本，用OCR + tesseract 4 (python)提取白文本。

、、

我试图使用tesseract OCR从图像(如在线美容产品图像)中提取文本，但大多数情况下，它无法检测到白色文本。问题是文本是混合的(，一些文本是黑色的，白色的，另一些是白色的，在黑色的上)，有什么方法可以克服这一点，提高OCR检测白文本的能力吗？经过预处理后，请找到附加图像( OCR作为输入的图像)。文本提取的结果如下：答:如果3éue a.‘一次，一次湿疹手部修复霜。BRe ie ccm Sec意味着se gern EgencuC es De Uae ene ai Ml. TS邱考尔4“：3 alas :E Risted& recowiniendeda _a PEC Ry

浏览 7提问于2020-03-23得票数 0

2回答