识别扫描pdf_扫描pdf识别_扫描 pdf 文字识别 - 腾讯云开发者社区

pdf、search、text

我试图在PDF文件中找到一些文本，但结果并不准确！举个例子，我有两个PDF文件，其中有一个词domiciiado。当我搜索这个单词(domiciliado)时，doc取器只显示一个PDF文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个PDF文件？PDF文件之间有什么区别吗？在一个PDF中，我只有文本，而其他PDF是文本和图像，这是从扫描页面。陷阱是什么？ P.S.：这两个PDF文件位于同一个目录中。

浏览 0提问于2016-08-16得票数 0

回答已采纳

1回答

ZXing PDF417 + ALL_CODE_TYPES

android、zxing、pdf417

使用ZXing (在安卓上)，如果你启动像这样的PDF417条形码扫描.List<String> oDesiredFormats = Arrays.asList("PDF_417".split(",")); IntentIntegrator integrator = new你启动一个“所有代码”(除了PDF417和其他几个)条形码扫描像这样.那么，如何启动一次条形码扫描，同时识别(所有标准代码和PDF

浏览 5提问于2014-03-21得票数 2

回答已采纳

1回答

如何使用python识别pdf中的图形？

pdf、text-parsing、pdf-parsing、pdfplumber

新的pdf解析。输入- pdf与一个图形，如这一个。输出应为-真或假也许还有别的办法？谢谢!

浏览 5提问于2022-11-17得票数 0

2回答

可将OCR文本插入回源PDF的OCR库

pdf、ocr

是否有库(或可执行文件)可以OCR PDF (通常是通过扫描纸张创建的PDF )，并将识别出的文本重新注入到PDF中？很可能是扫描图像背后的隐形文字。最好是开源的。(目标:我有一个巨大的由Lucene索引的PDF文件库。如果PDF包含文本，Lucene将更容易找到哪些PDF是相关的。)

浏览 3提问于2011-02-28得票数 2

0回答

.net的tesseract OCR能处理pdf文件吗？

c#、pdf、ocr、tesseract

我想在png和pdf文件上执行光符识别。我能够获得png文件的Tesseract 3.0.2 .net包装器工作，但我找不到任何用于PDf files.So的类，它是否适用于pdf files.If不然后请让我知道扫描pdf的任何其他开源库。我的需求是扫描特定圆的pdf格式的图表，并为这些圆创建超链接。

浏览 8提问于2016-12-27得票数 2

回答已采纳

1回答

使用从扫描PDF批量生成的OCR创建可搜索的PDF文件

pdf、ocr

其目标是自动将所有扫描文档转换为可搜索的PDF文件，而不仅仅是图像。扫描后的文档由扫描仪自动上传到Linux服务器上的共享文件中，作为PDF文件。该软件应该能够监视文件夹和自动OCR扫描的文件，并将识别的文本添加到PDF文件，使其可搜索。它还应该能够很好地处理多页PDF。Linux 在后台自动工作，不需要任何额外的手动步骤。能够以正确的方式将OCRed文本添加回PDF中(这样桌面搜索引擎就可以对其进行索引)

浏览 0提问于2014-04-28得票数 16

2回答

使用Google Cloud Vision的OCR PDF文件？

pdf、pdf-generation、ocr、google-cloud-vision

目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的PDF文件的后端？如果没有，如何使用Google Cloud Vision将PDF转换为OCRed PDF？据我所知，Cloud Vision目前支持PDF文件，但它只能将识别的文本输出为JSON文件。因此，似乎需要在Google Cloud Vision之外的另一个步骤中，将这个转换后的文本放在PDF中的图像顶部。我经常需要将扫描的文档转换为包含OC

浏览 0提问于2018-09-15得票数 4

1回答

如何创建高保真度PDF与可复制文本扫描？

pdf、scanner、text、ocr

一些公司通过扫描仪提供Windows软件，这些软件可以从扫描过的页面上创建PDF，这些页面看起来与扫描的内容完全一样(就好像它只是全页图像)，但文本是可以识别和复制的。如何在Ubuntu上创建这样的PDF？请注意，我不希望将扫描文本转换为常规文本。我想保持PDF外观的图片-完美的原始页面，但增加了一个公认的文本层，以方便使用。我有一个工作的高分辨率扫描仪，我使用的XSane目前.它扫描页面精细，并创建美丽，高新闻部

浏览 0提问于2017-09-24得票数 4

回答已采纳

1回答

寻找收据扫描器，而不是连续扫描任何长度的收据。

scanner

我正在寻找一个收据扫描仪，可以扫描非常长的收据(高达30英尺长)，并产生一个单一的图像或PDF。理想情况下，它将具有光学字符识别(optical字符识别)，并生成一个包含文本信息的PDF (例如，当您在Acrobat之类的地方打开PDF时，您可以搜索单词，或者可以使用单独的软件将文本内容提取到一个

浏览 0提问于2018-05-09得票数 2

1回答

如何快速从图像中扫描可搜索的pdf？

ios、swift、pdf、ocr、swift5

我想扫描文件与tesseract框架中的迅速和生成pdf文件，可以搜索。实际上，我使用此代码将图像转换为文本，但我希望生成主格式的图片，但格式将随着转换为文本而改变，并生成pdf文件。

浏览 2提问于2020-10-13得票数 0

回答已采纳

1回答

如何在PDF417 10.2上使用xamarin forms + zxing扫描驾照( iOS )

c#、xamarin、xamarin.ios、barcode、zxing

我使用Xamarin表单来编写iOS应用程序，并使用ZXing库扫描条形码。我试图读取一个驾驶执照(PDF417)条形码，但图书馆无法识别该条形码。如果我在PossibleFormats中包括UPC或其他条形码，它们将被正确扫描。我也确信我试图读取的条形码是PDF417条形码，因为Scandit能够正确识别它，而只使用PDF417条形码。，我需要更改什么才能正确识别PDF417条形码？options.PossibleFormats

浏览 6提问于2017-03-07得票数 3

回答已采纳

1回答

我的扫描器的IP地址是多少？

scanner、sane、ip-address、xsane

我试图配置和我的扫描仪与SANE和一些PDF软件，我正在试用.但它需要我的本地(USB)-connected扫描仪的IP地址(嗯，多功能)。识别这些信息的命令是什么？

浏览 0提问于2014-04-18得票数 0

回答已采纳

1回答

高亮注释没有突出显示我想要的行

18.04

我使用的是Ubuntu18.04.4LTS，我尝试使用文档查看器，当我尝试使用突出显示注释时，它会高亮显示下面和左边的行，我想知道是否有一种方法来修复这个问题，或者用我想要突出显示的内容来更精确地显示方法。

浏览 0提问于2020-08-12得票数 0

1回答

PyPDF2从扫描的pdf中提取垂直文本

python、python-3.x、pypdf2、pdfminer、pdf-extraction

我正在尝试提取文本从扫描的pdf使用PyPDF2。有些pdf包含垂直排列的文本。但页面的方向是肖像。是否有任何方法可以识别文本是否垂直对齐并使用pdfminer或PyPDF2读取PDF中的垂直行？

浏览 1提问于2018-09-27得票数 6

1回答

Howto:使用C#在光学字符识别前提高PDF质量

c#、pdf、ocr、readable

我正在创建一个服务，用于监视文件夹中的扫描文件。一旦文件存在，该服务就会提取它，并将其转换为可读的PDF。在此过程中，该服务还会搜索条形码。现在，对于光学字符识别，我们使用了Atalasoft的SDK ()。此外，条形码识别器也包含在此SDK中。我测试了Kofax ()。我正在寻找类似的东西，但这可以使用某种SDK-kit在服务中实现。

浏览 2提问于2011-07-06得票数 5

回答已采纳

1回答

用于识别ocr文本的Adobe acrobat 8命令行开关

pdf、adobe、ocr、acrobat、scanning

我想使用命令行，以执行许可的adobe acrobat 8来识别OCR文本已经扫描的pdf文件，并使其完全可搜索的pdf？提前感谢！

浏览 3提问于2010-04-09得票数 0

1回答

扫描PDF文档和图像的搜索工具

pdf、search、text-search

我正在寻找一个工具，可以搜索扫描PDF文档和图像中的文本。我试过Evernote，我真的很喜欢它，但是我不想在别人的云上有个人文档。我是一个开发人员，所以我可以自己做一些小事情，但解析PDF文件的文本是远远超出我的范围。无云服务应该能够可靠地处理多达100,000份文件。

浏览 0提问于2017-05-23得票数 2

回答已采纳

1回答

我想从OCR数据中提取表信息。

python、image、ocr、pytesser

我想从OCR数据中提取表格信息，我有原始文本和它的文本。我试过pytesseract，但找不到实际的实现。我试过这个：我希望从OCR数据中获得此表的表格结构，以供进一步处理。

浏览 3提问于2019-01-20得票数 0

10回答

光学字符识别软件推荐？

software-recommendation

我看到一些电子书/论文显然是从他们的纸质版本中扫描出来的，但电子图书/论文中的文本却能惊人地被复制出来。我想直接扫描的版本一定是由一些光学字符识别软件处理的。所以我想知道什么是推荐的光学字符识别软件？尤其是那些要么是Ubuntu的，要么是免费的？如果那些在Windows上要好得多，请告诉我。我特别感兴趣的那些OCR，可以接受一个扫描的pdf文件作为输入，但仍然产生作为输出的另一个pdf文件看起来与输入一个，但其文本可复制。请每个答案限

浏览 0提问于2010-10-22得票数 15

回答已采纳

3回答

如何区分数字创建的PDF和可搜索的PDF？

python、pdf

我目前正在分析一组PDF文件。我想知道有多少PDF文件属于这三个类别：可搜索PDF:扫描文档这是很容易识别图像仅PDF在我的领域，因为每个PDF包含文本。如果我不能提取任何文本，它只是图像。但我怎么知道它是“只是”可搜索的PDF，还是数字创建的PDF</

浏览 11提问于2020-08-19得票数 11

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用doc取器在PDF文件中搜索文本？

ZXing PDF417 + ALL_CODE_TYPES

如何使用python识别pdf中的图形？

可将OCR文本插入回源PDF的OCR库

.net的tesseract OCR能处理pdf文件吗？

使用从扫描PDF批量生成的OCR创建可搜索的PDF文件

使用Google Cloud Vision的OCR PDF文件？

如何创建高保真度PDF与可复制文本扫描？

寻找收据扫描器，而不是连续扫描任何长度的收据。

如何快速从图像中扫描可搜索的pdf？

如何在PDF417 10.2上使用xamarin forms + zxing扫描驾照( iOS )

我的扫描器的IP地址是多少？

高亮注释没有突出显示我想要的行

PyPDF2从扫描的pdf中提取垂直文本

Howto:使用C#在光学字符识别前提高PDF质量

用于识别ocr文本的Adobe acrobat 8命令行开关

扫描PDF文档和图像的搜索工具

我想从OCR数据中提取表信息。

光学字符识别软件推荐？

如何区分数字创建的PDF和可搜索的PDF？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐