pdf文件识别软件 - 腾讯云开发者社区

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

2回答

使用Google Cloud Vision的OCR PDF文件？

、、、

目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的PDF文件的后端？如果没有，如何使用Google Cloud Vision将PDF转换为OCRed PDF？据我所知，Cloud Vision目前支持PDF文件，但它只能将识别的文本输出为JSON文件。因此，似乎需要在Google Cloud Vision之外的另一个步骤中，将这个转换后的文本放在PDF中的图像顶部。

浏览 0提问于2018-09-15得票数 4

1回答

寻找收据扫描器，而不是连续扫描任何长度的收据。

我正在寻找一个收据扫描仪，可以扫描非常长的收据(高达30英尺长)，并产生一个单一的图像或PDF。理想情况下，它将具有光学字符识别(optical字符识别)，并生成一个包含文本信息的PDF (例如，当您在Acrobat之类的地方打开PDF时，您可以搜索单词，或者可以使用单独的软件将文本内容提取到一个.txt文件中)。因为我不希望它用于像Neat这样的软件，所以如果可能的话，我不愿意为包含的软件支付额外的钱。

浏览 0提问于2018-05-09得票数 2

1回答

如何在pdf文件中搜索文本？

我运行的是ubuntu 22.0.4我试过evince，但它找不到我尝试过的文本，但是它找不到我尝试过的pdfgrep文本，但是它找不到文本

浏览 0提问于2023-04-14得票数 -1

1回答

如何使用GNU Bash查找特定类型的文件而不中继文件扩展名？

、、

我有许多没有名字扩展分散在子目录中的pdf文件。这使我的书目软件无法组织它们。我希望识别这些文件，在一个新目录中收集它们，并在那里添加缺少的.pdf扩展名。

浏览 8提问于2022-01-30得票数 0

2回答

恶意软件可以以任何形式出现吗？

、

在阅读了@Iszi对这个问题的答复之后，他说电子邮件中附加的病毒不仅存在于.EXE文件中.它们可以是任何形式的文档- PDF，PPT，DOC，XLS，SWF等。是否有任何格式不能携带恶意软件，例如文本文件？因为任何人都可以将文件扩展名重命名为.txt，这是一个没有意义的问题吗？

浏览 0提问于2013-08-19得票数 2

5回答

如何识别客户端计算机是否支持PDF文件格式

、、

嗨， XML页不能显示在文本内容中发现无效字符。错误处理资源'...我需要以不同的方式处理这种情况，即在这种情况下，文件应该保存到系统的物理位置，因为我需要识别客户机是否有pdf软件</

浏览 10提问于2010-07-07得票数 4

1回答

使用LEADTOOLS和pdf工具将PDF文档转换为jpeg

、、

我们有pdf文档(来源:相机或扫描仪)，我们想要转换为jpeg。我们更希望从源pdf文件中获取此值。例如: Adobe Acrobat软件识别源pdf文件DPI，并使用该文件创建j

浏览 6提问于2015-07-19得票数 1

10回答

光学字符识别软件推荐？

我想直接扫描的版本一定是由一些光学字符识别软件处理的。谢谢和问候！请每个答案限制一个软件。

浏览 0提问于2010-10-22得票数 15

回答已采纳

1回答

识别和提取PDF文档的特定部分

、、、、

我有几个PDF格式的考试。我想通过编程将每个问题作为一个单独的图像/文档来提取。OCR并不理想，因为它没有很好地维护代码/方程格式。然后在pdf中找到他们的位置，从一个问题的开始到下一个问题的开始，提取一个iamge。是否有任何框架或软件可以做到这一点，或提供某种替代方法，以使这更容易？

浏览 8提问于2017-11-07得票数 4

回答已采纳

1回答

使用从扫描PDF批量生成的OCR创建可搜索的PDF文件

、

其目标是自动将所有扫描文档转换为可搜索的PDF文件，而不仅仅是图像。扫描后的文档由扫描仪自动上传到Linux服务器上的共享文件中，作为PDF文件。该软件应该能够监视文件夹和自动OCR扫描的文件，并将识别的文本添加到PDF文件，使其可搜索。它还应该能够很好地处理多页PDF。Linux 在后台自动工作，不需要任何额外的手动步骤。能够以正确的方式将OCRed文本添加回P

浏览 0提问于2014-04-28得票数 16

1回答

从可搜索的pdf中读取，不带ocr

我目前正在使用扫描仪将我的PDF转换为可搜索的PDF。OCR已经处理好了，因为我可以在PDF中使用ctrl-f。但是，我如何才能从我的程序中获取OCR的内容。是否可以通过读取文件来公开访问OCR文本？

浏览 1提问于2011-12-15得票数 0

1回答

Howto:使用C#在光学字符识别前提高PDF质量

、、、

我正在创建一个服务，用于监视文件夹中的扫描文件。一旦文件存在，该服务就会提取它，并将其转换为可读的PDF。在此过程中，该服务还会搜索条形码。在此之后，提取文本，并将文件及其文本存储到我们软件的数据库中。该位置基于条形码。我测试了Ko

浏览 2提问于2011-07-06得票数 5

回答已采纳

6回答

使用CSS创建带有页面布局的PDF文件

、

我正在搜索一个系统，它允许我从html生成PDF文件。我想使用尽可能多的CSS样式。这将是很棒的功能：无论系统是免费的还是商业的，这都无

浏览 10提问于2011-01-21得票数 3

2回答

文本提取库不返回非空页的文本。

、

我编写了一个从PDF文档中提取文本的程序。但一份PDF文件给了我空的短信。我可以在Acrobat中打开PDF文件，它可以正常工作。我的代码可以很好地处理其他PDF文件，所以我想知道是什么导致了这个问题。我用了PyPDF2和PyPDF2，但结果是一样的。所以这个文件一定有问题： from PyPDF2 import PdfReader

浏览 12提问于2022-06-27得票数 0

1回答

在PDF文件中查找文本消息的工具

、、、

目标：文本消息是PDF文件中的图片。你需要什么工具来使用我订购的工具？不管它付不付服务费。您只需要发送一个PDF文件和短信，然后检索答案，如果有匹配和结果是什么。

浏览 0提问于2018-08-18得票数 1

2回答

PDF格式的图像为移动设备？

、、

我有PDF文件，我想发送到智能手机作为jpg的，但我想保留图像，文本格式等。我发现一些工具转换PDF的图像，但大多数不会渲染它首先在智能手机上可读。我发现的一个软件可以将eBook转换成适合智能手机的图像( PDF to Images)，它使用字符识别并重写PDF (你会丢失任何图像或格式)。有没有一种方法可以将PDF转换为要在移动设备上查看的图像？谢谢!

浏览 0提问于2011-07-14得票数 0

1回答

如何在户外阅读图片和pdf格式的内容

、、

我想知道如何搜索内容从图像和PDF在户外使用光学字符识别集成，请让我知道的步骤，我可以做到这一点？？使用Kofax或EpheSoft扫描软件。告诉我步骤..。请帮帮我.. 在进阶时谢谢

浏览 3提问于2014-08-25得票数 0

1回答

对于某些文件，PyPDF2仅返回空行

、、、

我正在编写一个脚本，它可以“读取”PDF文件，然后自动重命名它从字典中识别的文件。然而，对于某些PDF，PyPDF2只返回空行，而对于其他PDF则可以很好地工作。读取文件的代码：file = 'sample.pdf' with open(file, "rb") as f:\n\\n\\n'" 奇怪的是，当我用Ad

浏览 3提问于2017-07-28得票数 2

1回答

如何测试ClamAV服务是否存在潜在威胁

、、、、

作为企业软件项目的一部分，我们的应用程序连接到由ClamAV支持的防病毒服务，使用ICAP作为通信协议。我想测试反病毒服务对恶意文档的响应，但是，当然，我不能使用实际上被恶意感染的文档。我发现EICAR反恶意软件测试文件，但它似乎只是作为一个.txt或.zip和系统只允许上传Word或PDF。反病毒服务只在将EICAR发送给它时才识别EICAR，而不是当它嵌入到Word或PDF中时。我的问题是：如何创建一个被ClamAV认为是威胁的单词和/或PDF文档，尽管

浏览 9提问于2021-12-14得票数 0

1回答

Zathura EPUB支持问题：“未知文件类型：'application/zip'”

、、

因此，阿尔维基解释说，zathura需要zathura-pdf-mupdf包来支持EPUB。user@host :~/Downloads/test $ > dpkg -s zathura-pdf-mupdf | grep(0.3.4) (/usr/lib/x86_64-linux-gnu/zathura/libpdf-m

浏览 0提问于2020-06-20得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Google Cloud Vision的OCR PDF文件？

寻找收据扫描器，而不是连续扫描任何长度的收据。

如何在pdf文件中搜索文本？

如何使用GNU Bash查找特定类型的文件而不中继文件扩展名？

恶意软件可以以任何形式出现吗？

如何识别客户端计算机是否支持PDF文件格式

使用LEADTOOLS和pdf工具将PDF文档转换为jpeg

光学字符识别软件推荐？

识别和提取PDF文档的特定部分

使用从扫描PDF批量生成的OCR创建可搜索的PDF文件

从可搜索的pdf中读取，不带ocr

Howto:使用C#在光学字符识别前提高PDF质量

使用CSS创建带有页面布局的PDF文件

文本提取库不返回非空页的文本。

在PDF文件中查找文本消息的工具

PDF格式的图像为移动设备？

如何在户外阅读图片和pdf格式的内容

对于某些文件，PyPDF2仅返回空行

如何测试ClamAV服务是否存在潜在威胁

Zathura EPUB支持问题：“未知文件类型：'application/zip'”

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐