腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将扫描的
pdf
转换为R中可搜索的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。有没有一种方法可以将扫描的
pdf
转换成可读的
pdf
,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
1
回答
用c#编程
编辑
PDF
(非固定
PDF
)
、
、
、
、
是否可以
编辑
在C#中不可填充的
PDF
格式 所需经费: 必须
编辑
以编程方式填写的表格中的文本和数据,并保存它。
浏览 6
提问于2012-06-28
得票数 1
1
回答
关于一个好的自由软件/网站将
pdf
转换为EPUB的建议
、
我发现,当我将一个包含大量文本的
pdf
文件转换成EPUB格式(例如书籍)时,它们会在同一句话之间被分割成段落,我使用过-量程,Toepub.com和许多在大坏网站上可以找到的网站;-)。
浏览 0
提问于2019-11-14
得票数 0
1
回答
如何从
pdf
文件的图像中提取文本?
一切正常,但它不是从
pdf
文件中提取的图像。Tika可以从
pdf
和图像中提取文本,但不能从包含图像的
pdf
中提取文本。我有点困惑。有没有办法做到这一点?是否需要将
PDF
文件转换为图像?
浏览 3
提问于2018-10-11
得票数 1
2
回答
Powershell和Adobe
、
我们有许多
pdf
文件,它们都是解锁的,它们都有文本、图片等,每次我们必须打开adobe上的文件并手动打开它们时,我想也许有一个更好的方法来处理PowerShell,如果不是的话,我们必须做超过1000个文件
浏览 7
提问于2021-12-22
得票数 -2
回答已采纳
2
回答
如何通过API网关将AWS Lambda中的"
pdf
“和"html”文件作为“事件”传递?
、
、
、
我试图将"
pdf
“或"html”文件直接传递到lambda函数中。但是我不明白它应该以什么正确的格式接收?我能够理解如何使用以下代码通过lambda函数传递“图像”文件:但是如何发送
pdf
或html文件呢?(img): return
ocr
_text except Ex
浏览 1
提问于2020-05-06
得票数 0
回答已采纳
1
回答
如何下载谷歌扫描的.
pdf
OCRed?
、
我有一个电子邮件与扫描的.
pdf
附加在我的Gmail帐户。当我点击“查看”,我看到谷歌有OCRed它。当我单击“下载”时,
PDF
是原始的,即不包含OCRed。如何通过谷歌下载内容为.
pdf
的OCRed文件?
浏览 0
提问于2012-11-26
得票数 2
2
回答
如何在
pdf
文件中复制图像中的文本?
、
、
我可以使用evince文档查看器使用文本查看
pdf
图像,但是我不能选择图像中的文本来复制和粘贴。如何在
pdf
文件中从图像中复制文本?
浏览 0
提问于2014-09-19
得票数 0
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
2
回答
可选择文本的
PDF
查看器
在Ubuntu源代码中有一个很好的
PDF
查看器可以让我选择和复制文本吗?Okular是一个很好的应用程序,因为它拥有比Document更多的工具。然而,我真正需要做的就是从
pdf
中选择和复制文本。有什么能让我这么做?
浏览 0
提问于2015-12-15
得票数 7
回答已采纳
1
回答
在r中的
pdf
上执行
ocr
时出错
、
、
、
、
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
1
回答
如果无法删除文件,请等待,然后再试一次。
中暂时不可用的资源 使用&和2>&1 &,这应该会迫使PHP等待脚本完成,但事实并非如此。因此,我的问题是:是否有办法这样做,迫使PHP等待直到执行完成;或者,我如何让PHP等待,例如,10秒,在删除失败时再试一次(如果再次失败,则再等待)
编辑
:执行删除:unlink("temp/1.
浏览 2
提问于2018-11-13
得票数 0
回答已采纳
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
11
回答
免费的
OCR
软件,使
PDF
可搜索(与可搜索的文本在正确的地方)
、
、
、
、
是否有任何免费的
OCR
软件(用于Linux和/或Windows)可以像Acrobat那样将
PDF
扫描文档作为输入并输出可搜索的
PDF
?使用可搜索的
PDF
格式,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。我知道Linux上的gscan2
pdf
可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景扫描页面上的文本完全不同步。这是因为gscan2
pdf
将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或小段落发送到<em
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
1
回答
带有图像的
PDF
文件的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
更新多个列,使其与另一列相等
、
例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。
OCR
0000000001 Yes 100 06000093.
pdf
OCR
0000000004
OCR
0000000006 No 95
浏览 0
提问于2014-03-22
得票数 0
3
回答
操作
PDF
文件,Windows Forms C#
、
、
、
我有
pdf
页面,我想打印/保存从C#的windows窗体应用程序,但是我想修改文件之前,在添加一个用户编写的最终评论页面(只有文本)。 谁能给我指出一个简单的
pdf
库,它用简单的代码做这件事。
浏览 2
提问于2010-11-08
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券