pdf转换器ocr - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

扫描pdf至doc

有没有人知道是否有一个免费的在线OCR转换器，可以转换大扫描的pdf文件(例如，我想转换一个扫描的28 of大小的pdf文档)？我试过很多ocr转换器，但都失败了。

浏览 0提问于2016-01-17得票数 0

2回答

如何将pdf格式转换为eBook格式

、

是否有方法将PDF文档转换为eBook格式，如epub、azw或mobi？我正在寻找一个应用程序，这是快速的转换。我刚试过口径。10分钟后，甚至没有达到2%的转换。所以请不要有口径。CLI是首选。

浏览 0提问于2013-04-26得票数 9

回答已采纳

1回答

高新ECM含量转换

我使用Alfresco将TIFF转换为PDF，使用Tiger OCR库()<?BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'> <bean id="transformer.Ocr.Tiff2Pdf调试u

浏览 1提问于2011-04-15得票数 0

2回答

我使用像富士通iX500 ScanSnap扫描仪这样的硬件解决方案进行实时扫描，同时使用Foxit PhantomPDF向PDF中的图像添加文本。这两种解决方案都带来了不错的OCR，但是也有一些缺陷，比如在非文本上出现错误，或者99%的文本在页面上被漏掉，因为页面的角落中有3-4个单词与页面上的所有其他文本一样，它们都是90度旋转的。最先进的OCR解决方案是将图像转换为可搜索的PDF，还是将(隐藏的)文本添加到仅包含图像的现有PDF中(添加搜索功能)？

浏览 0提问于2018-05-25得票数 0

1回答

Python OCR Sudoku图像

、

我需要使用ocr来转换sudoku图像上的数字，并将其作为网格读取。

浏览 3提问于2022-06-16得票数 0

1回答

关于一个好的自由软件/网站将pdf转换为EPUB的建议

、

我发现，当我将一个包含大量文本的pdf文件转换成EPUB格式(例如书籍)时，它们会在同一句话之间被分割成段落，我使用过-量程，Toepub.com和许多在大坏网站上可以找到的网站;-)。

浏览 0提问于2019-11-14得票数 0

1回答

以编程方式搜索多个PDF文档以获得一系列关键字

问题keyword-set-1 = "foo" "bar";和一个PDF文件，其中包含以下文本 "jon doe and然而，我还没有找到一个PDF文件的解决方案。我考虑过使用PDF矿工将所有PDF转换

浏览 4提问于2014-02-15得票数 0

1回答

Applescript或Automator:运行Acrobat对OCR多个PDF文件进行批处理，更多

、、、、

我使用ScanSnap S1500M将所有纸质文档扫描到/PDF-S1500M/-我想使用对文本进行OCR。我想(每天)自动化这个过程：我应该用自动售货

浏览 5提问于2011-08-18得票数 1

回答已采纳

3回答

有没有办法制作一个无法转换成word的pdf？

、、、

我们有一个生成PDF文件的系统。但是任何人都可以使用在线pdf to word转换器来转换这些文件。在Yii或PHP中有什么选项可以阻止这种情况吗？

浏览 0提问于2016-03-07得票数 0

4回答

运行反引号/exec()时的PHP路径问题

、、

即$f = `java -jar /OCR/ocr.jar /Folder/$path /ocr/output.txt`;java -jar /OCR/ocr.jar /Folder/Sub\ Folder/filetoocr.pdf /

浏览 1提问于2010-04-15得票数 0

1回答

简单的OCR。从PDF文件中提取文本并使用它启动工作流

、

我将与pdf三明治和tesseract OCR结合使用。我希望从插入到文件夹的文档中获取文本，然后在新的工作流中使用文本和pdf文件。我已经成功地完成了OCR提取，以及如何使用插入目录的文件启动工作流，但是我无法从文件中获取文本并在工作流中使用它。我从哪里开始实现这个功能？你好，拉法ł

浏览 2提问于2017-05-09得票数 1

回答已采纳

1回答

在终端中运行命令，并在输出中包含输入名

、、、、

我在Dolphin服务菜单文件中有这一行，该文件包含用于PDF处理的许多其他命令：它的优点是提供表单MY_PDF_ocr.pdf的输出文件，从而保留输入文件的名称。为此，我可以用这句话： Exec=konsole --noclose -e ocrmypdf "%u&

浏览 0提问于2022-11-30得票数 0

回答已采纳

2回答

从给定坐标提取PDF文本

、、

我想使用Ghostscript从PDF的一部分(使用坐标)提取文本。有人能帮我吗？

浏览 3提问于2011-05-31得票数 45

1回答

在r中的pdf上执行ocr时出错

、、、、

在r中的pdf上尝试OCR，这给了我错误。运行代码后，也会生成"i.txt“文件，但仍然会出现错误。'"D:/Software_for_PDF_OCR/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/PDF_OCR_File/test.pdf -f 1 -lD:/PDF_OCR_File/t

浏览 3提问于2017-09-20得票数 0

3回答