如何从图像中提取文本 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

如何用Microsoft.media.ocr制作带有包围框覆盖的实时摄像头，这样用户就可以在UWP中触摸和使用文本到语音？

windows、uwp、ocr

我已经实现了实时摄像头和使用Android文本识别，当我触摸边界框覆盖，文本到语音作品，但在通用窗口，应用程序无法获得任何文档，谁能帮助如何实现在实时相机OCR？

浏览 0提问于2018-04-16得票数 0

回答已采纳

1回答

我们可以使用Selenium从图像中获取文本吗？

selenium-webdriver、testng、page-objects、eclipse

这是图像的路径，为了安全起见，我必须将显示在图像上的文本输入到文本中， private WebElement textShown; 这是XPath，我在这里填充图像上显示的文本</em

浏览 0提问于2023-03-05得票数 -1

回答已采纳

1回答

如何从PDF中提取文本，包括图像和文本

python、nlp、text-mining、text-extraction

我要从多个PDF文件中提取文本。PDF文件包括文本和一些图像，甚至一些页面是扫描的页面(我假设扫描的页面就像图像)。我按照下面的命令从PDF文件中提取文本。我的问题是，如何使用条件编辑命令，以检查每个页面是否包含任何图像，然后从图像中提取文本。如果你能帮助我，我将不胜感激。

浏览 10提问于2021-10-14得票数 0

1回答

无法从特定PDF中提取文本和图像

ruby、pdf、command-line、ubuntu-14.04、pdfbox

有谁能让我知道如何从PDF中提取所有文本和图像？在类似的场景中，我能够提取图像，我使用Google创建了一个PDF，只有几行文本和2个png图像。但是，我无法从样本中提取图像。我试过以下几点：1)“pdf阅读器”创业板，它只支持少数格式的图像提取。 2)“文档分割”创业板，它只能提取<

浏览 0提问于2015-05-20得票数 2

回答已采纳

1回答

如何打开选项以将标准化图像存储到我的知识库

azure-cognitive-search

文档- -表示“当imageAction被设置为非"none”的值时，新的normalized_images字段将包含一个图像数组“。如何从门户网站执行此操作？我单击索引器的“高级选项”，在“要提取的数据”下拉列表中看到的唯一选项是：“内容和元数据”、“所有元数据”和“仅存储元数据”。不用说，"normalized_images“字段当前不在我的投影对象中。

浏览 2提问于2019-11-03得票数 0

1回答

我最近建立了一个Linux服务器，可以使用Xpdf的一部分pdftotext命令将基于文本的Xpdf转换为文本，还可以使用gs (Ghostscript)和tesseract命令的组合将基于图像的Xpdf转换为文本。当我已经知道PDF是基于文本还是基于图像时，这两种解决方案都能很好地工作。但是，为了自动化将许多PDF转换为文本的过程，我需要能够判断PDF是基于文本的还是基于图像的，这样我就知道在PDF上运行哪一组进程。在PHP中有没有

浏览 5提问于2016-09-23得票数 1

回答已采纳

3回答

如何识别场景图像的文本

c#、image-processing、ocr

我正在尝试构建一个系统(使用C#)，可以识别场景图像的文本。我看到场景文本识别是一项具有挑战性的任务，因为低分辨率，复杂的背景，不均匀的闪电或模糊效果…… 任何解决这个问题的想法都将不胜感激。

浏览 0提问于2012-01-08得票数 0

3回答

计算机视觉

computer-vision、text-extraction

我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python <3版本兼容。任何关于如何进行和获取相关代码和好文件的想法。

浏览 8提问于2018-05-28得票数 1

回答已采纳

2回答

来自不同文件类型的文本提取库，PDF，DOC，DOCX，TXT c#

c#、text、information-retrieval

我正在构建以多文件格式搜索文本的信息检索系统，我已经尝试过EPocalipse IFilter Lirary，但是在尝试读取docx文件时通过了一个异常，并且我尝试了Toxy Library --尽管这是

浏览 5提问于2016-07-03得票数 5

回答已采纳

1回答

azure计算机视觉检测文本

azure

我正在使用azure计算机视觉从图像中提取文本，它按预期工作，但现在我面临着一个挑战，我必须从图像中检索特定的文本，而不是从图像中检索所有文本，并且我想要提取的文本可能在不同的图像中不同。(也许这些图像可以有一个共同的文本) Azure计算机视觉有什么方法可以帮助我做到这一点

浏览 67提问于2021-11-19得票数 1

回答已采纳

1回答

如何对中较大句子的一部分块进行分组？

ocr、google-cloud-vision

我正在使用Google Cloud Vision API on Python来检测囤积板中通常在商店/商店上面发现的文本值。到目前为止，我已经能够检测到单个单词及其包围多边形的坐标。

浏览 1提问于2018-09-18得票数 0

回答已采纳

1回答

如何使用pdfbox获得pdf的最大fontsize

object、font-size、pdfbox、pdf-extraction

我使用pdfbox从pdf中提取一些信息，但是如何提取每个对象的信息？如果其中一个包含流，我如何解码该流以显示？我能从一个pdf框中得到最大字体大小的吗？

浏览 8提问于2015-03-23得票数 1

1回答

OCR识别奇怪的字符。为什么？

character、ocr

,wlñzf . 94' kzl 5. vsmNs/.caelumcombr 在搜索中，我配置了这个：baseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz

浏览 1提问于2012-11-22得票数 1

1回答

从图像中获取手写文本

java、image、ocr、eclipse-mars

如何在Java中从图像中提取手写文本，如银行表单图像？我尝试使用Tesseract，OCR，GOCR，但对我不起作用。在Java中，有没有其他方法可以从图像中提取手写文本，其工作效率至少为80-90%？

浏览 17提问于2017-05-30得票数 1

1回答

提取PDF中表示为图像的文本- itextsharp

c#、pdf、itextsharp、itext

我在使用ITextSharp从PDF文件中提取文本的过程中，我已经成功地提取了我感兴趣的文本的一部分，但当我继续我的‘文本’提取时，我注意到一些文本单词(当我使用itextsharp从整个页面提取整个文本时无法获得文本)实际上被表示为图像。因此，简而言之:如何提取包含在PDF图像对象中

浏览 4提问于2013-06-07得票数 2

回答已采纳

3回答

如何使用任何Java库使现有的PDF文本可搜索？用OCR

java、ocr、pdfbox

如何使用任何java库生成可搜索的文本？开源或付费。如何使用PDFBox将OCR应用于pdf？如何使pdf文本可编程搜索使用pdfbox，我搜索了很多。没有找到任何解决办法。

浏览 8提问于2014-04-04得票数 0

回答已采纳

1回答

如何在OpenCV - JAVA中设置感兴趣区域

java、opencv、ocr、tesseract

我有一张名片的图像，为了从图像中仅提取名片，我对其执行了透视变换。现在，我希望将此图像提供给tesseract-ocr引擎。在此之前，我希望提取包含一些文本的感兴趣区域，并提供该区域，而不是整个图像。如何从卡片中仅提取文本。以下是该图像的示例：

浏览 1提问于2014-11-08得票数 1

1回答

如何通过Firebase ML套件文本识别扫描七段显示器？

flutter、dart、ocr、firebase-mlkit、text-recognition

Firebase Ml工具包中的文本识别API不能识别我试图从称重计扫描出来的数字或七段显示数字，有没有办法解决这个问题？我尝试了flutter应用程序的firebase ml vision的Dart包，并使用了firebaseVisionImage类、文本识别器类和visionText类，如下所示。

浏览 2提问于2019-07-05得票数 1

1回答

波斯文件的PDFBOX

java、pdf、pdfbox、arabic、persian

我想使用pdfBox从波斯语pdf文件中提取测试，但是它返回所有波斯字符的"?" (它正确地返回同一文档中的拉丁单词)。我怎么才能修好它？有什么建议吗？

浏览 3提问于2018-08-29得票数 3

1回答

图像到文本转换python

python-3.x、ocr、python-tesseract

我正在尝试使用python中的pytesseract模块从图像中仅提取突出显示的文本。问题是我无法提取突出显示的部分，整个图像正在转换为文本，我不知道如何提取基于背景颜色的特定部分。

浏览 11提问于2020-05-12得票数 0

点击加载更多

如何用Microsoft.media.ocr制作带有包围框覆盖的实时摄像头，这样用户就可以在UWP中触摸和使用文本到语音？

我们可以使用Selenium从图像中获取文本吗？

如何从PDF中提取文本，包括图像和文本

无法从特定PDF中提取文本和图像

如何打开选项以将标准化图像存储到我的知识库

如何区分PHP中的“文本”PDF和“图像”PDF？

如何识别场景图像的文本

计算机视觉

来自不同文件类型的文本提取库，PDF，DOC，DOCX，TXT c#

azure计算机视觉检测文本

如何对中较大句子的一部分块进行分组？

如何使用pdfbox获得pdf的最大fontsize

OCR识别奇怪的字符。为什么？

从图像中获取手写文本

提取PDF中表示为图像的文本- itextsharp

如何使用任何Java库使现有的PDF文本可搜索？用OCR

如何在OpenCV - JAVA中设置感兴趣区域

如何通过Firebase ML套件文本识别扫描七段显示器？

波斯文件的PDFBOX

图像到文本转换python

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐