pdf怎么编辑ocr内容 - 腾讯云开发者社区

、、、、

是否可以编辑在C#中不可填充的PDF格式所需经费：必须编辑以编程方式填写的表格中的文本和数据

浏览 6提问于2012-06-28得票数 1

1回答

关于一个好的自由软件/网站将pdf转换为EPUB的建议

、

我发现，当我将一个包含大量文本的pdf文件转换成EPUB格式(例如书籍)时，它们会在同一句话之间被分割成段落，我使用过-量程，Toepub.com和许多在大坏网站上可以找到的网站;-)。

浏览 0提问于2019-11-14得票数 0

1回答

将扫描的pdf转换为R中可搜索的pdf

、

我有一个pdf，大约50页扫描表。我需要最终把它刮到R中，这样我就可以清理数据并将其导出为.csv。环顾在线，我所能得到的最远就是将扫描的pdf作为一个字符对象读取到R中，但这会使格式发生很大的变化，因此表中的列都错对齐了，并出现了无序。有没有一种方法可以将扫描的pdf转换成可读的pdf，这样我就可以在tabulizer中抓取它了？还是另一种将扫描的pdfs抓取到表中的方法？

浏览 5提问于2022-11-16得票数 0

1回答

在终端中运行命令，并在输出中包含输入名

、、、、

我在Dolphin服务菜单文件中有这一行，该文件包含用于PDF处理的许多其他命令：它的优点是提供表单MY_PDF_ocr.pdf的输出文件，从而保留输入文件的名称。为此，我可以用这句话： Exec=konsole --noclose -e ocrmypdf "%u&

浏览 0提问于2022-11-30得票数 0

回答已采纳

1回答

使用Python PyPDF2从扫描的pdf (图像)中提取文本

、、、

我一直在尝试从扫描的PDF中提取文本(具有不可选文本的图像)。我想要的信息，包含日期，发票编号从pdf链接()。from PIL import Imagepage = pdf_reader.getPage

浏览 2提问于2020-05-27得票数 1

回答已采纳

1回答

如果无法删除文件，请等待，然后再试一次。

我只是不知道该怎么做。OCR.bat" 2>&1 &');编辑:执行删除：unlink("temp/1.pdf");和unlink("temp/2.pdf"

浏览 2提问于2018-11-13得票数 0

回答已采纳

2回答

服务3 PDF搜索没有索引所有单词

、、、、

我开始了一个完整的爬行，当我使用搜索时，我正在返回PDF搜索。这是一个很大的变化，从以前的PDF内容搜索是不存在的。目前，业务部门已经注意到，对于某些词，他没有找到合适的PDF。从所有迹象来看，似乎对于某些PDF，并不是所有的词都有索引。有人能帮忙吗？

浏览 0提问于2012-08-20得票数 0

回答已采纳

1回答

如何与谷歌云视觉OCR一个pdf？

、、

我在我的笔记本电脑Windows 10上使用C#.net我需要让pdf文件正常工作 { }但

浏览 3提问于2021-04-22得票数 1

回答已采纳

3回答

更改windows批处理中的文件扩展名

、、、

到目前为止，我只想将扩展从".pdf.OCR.pdf“更改为".pdf”，我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么？

浏览 5提问于2015-08-27得票数 1

回答已采纳

1回答

从可搜索的pdf中读取，不带ocr

我目前正在使用扫描仪将我的PDF转换为可搜索的PDF。OCR已经处理好了，因为我可以在PDF中使用ctrl-f。但是，我如何才能从我的程序中获取OCR的内容。是否可以通过读取文件来公开访问OCR文本？

浏览 1提问于2011-12-15得票数 0

3回答

pdf、chm和djvu文件的桌面搜索实用程序

我想写一个工具，帮助我在linux中搜索pdf/chm/djvu文件。有什么关于如何去做的建议吗？主要问题是从所有这些文件读取/导入数据。这可以用C和shell脚本来实现吗？

浏览 1提问于2008-08-30得票数 3

3回答

我试图使用Tesseract OCR在多个大pdf文件上执行OCR (~400-600页)。我不一定要从所有页面中提取文本，但我只想要几页(页码已知)。PDF文件似乎已经在上面执行了某种OCR，但这不是一个好工作。0].show()这就是输出应该是什么样子：我确实认为在PDF上进行的OCR在这里引起了一些问题。我不知道怎么绕过它，有人能帮忙吗？我也尝试了OCR，手动将页面转换成图像(剪短工具)，<

浏览 10提问于2021-06-06得票数 2

1回答

无法对内容复制设置为不允许的PDF文件执行OCR

、、、

由于安全原因，我无法上传PDF文件，但可以创建一个内容复制设置为不允许的pdf文件，然后尝试对此文件执行OCR。OCR返回一个错误，指出文件受密码保护或类似的东西。谁能告诉我有没有一种方法可以对这样的文件执行OCR？

浏览 5提问于2020-07-19得票数 2

3回答

将pdf的内容读取为字符串

、、

如何将PDF的内容以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。PDF来自一个url，我将它加载到一个web视图中并使用NSURL扩展来缓存它。我怎样才能获得这个网页，并阅读网址的内容。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.pdf, encoding: NSUT

浏览 14提问于2015-08-02得票数 0

回答已采纳

2回答