腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用c#编程
编辑
PDF
(非固定
PDF
)
、
、
、
、
是否可以
编辑
在C#中不可填充的
PDF
格式 所需经费: 必须
编辑
以编程方式填写的表格中的文本和数据
浏览 6
提问于2012-06-28
得票数 1
1
回答
关于一个好的自由软件/网站将
pdf
转换为EPUB的建议
、
我发现,当我将一个包含大量文本的
pdf
文件转换成EPUB格式(例如书籍)时,它们会在同一句话之间被分割成段落,我使用过-量程,Toepub.com和许多在大坏网站上可以找到的网站;-)。
浏览 0
提问于2019-11-14
得票数 0
1
回答
将扫描的
pdf
转换为R中可搜索的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。有没有一种方法可以将扫描的
pdf
转换成可读的
pdf
,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
如果无法删除文件,请等待,然后再试一次。
我只是不知道该
怎么
做。
OCR
.bat" 2>&1 &');
编辑
:执行删除:unlink("temp/1.
pdf
");和unlink("temp/2.
pdf
"
浏览 2
提问于2018-11-13
得票数 0
回答已采纳
2
回答
服务3
PDF
搜索没有索引所有单词
、
、
、
、
我开始了一个完整的爬行,当我使用搜索时,我正在返回
PDF
搜索。这是一个很大的变化,从以前的
PDF
内容
搜索是不存在的。目前,业务部门已经注意到,对于某些词,他没有找到合适的
PDF
。从所有迹象来看,似乎对于某些
PDF
,并不是所有的词都有索引。有人能帮忙吗?
浏览 0
提问于2012-08-20
得票数 0
回答已采纳
1
回答
如何与谷歌云视觉
OCR
一个
pdf
?
、
、
我在我的笔记本电脑Windows 10上使用C#.net我需要让
pdf
文件正常工作 { }但
浏览 3
提问于2021-04-22
得票数 1
回答已采纳
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
1
回答
从可搜索的
pdf
中读取,不带
ocr
我目前正在使用扫描仪将我的
PDF
转换为可搜索的
PDF
。
OCR
已经处理好了,因为我可以在
PDF
中使用ctrl-f。 但是,我如何才能从我的程序中获取
OCR
的
内容
。是否可以通过读取文件来公开访问
OCR
文本?
浏览 1
提问于2011-12-15
得票数 0
3
回答
pdf
、chm和djvu文件的桌面搜索实用程序
我想写一个工具,帮助我在linux中搜索
pdf
/chm/djvu文件。有什么关于如何去做的建议吗? 主要问题是从所有这些文件读取/导入数据。这可以用C和shell脚本来实现吗?
浏览 1
提问于2008-08-30
得票数 3
3
回答
为什么
pdf
2image给我一个空白的图像文件?
、
、
、
、
我试图使用Tesseract
OCR
在多个大
pdf
文件上执行
OCR
(~400-600页)。我不一定要从所有页面中提取文本,但我只想要几页(页码已知)。
PDF
文件似乎已经在上面执行了某种
OCR
,但这不是一个好工作。0].show()这就是输出应该是什么样子: 我确实认为在
PDF
上进行的
OCR
在这里引起了一些问题。我不知道
怎么
绕过它,有人能帮忙吗? 我也尝试了
OCR
,手动将页面转换成图像(剪短工具),<
浏览 10
提问于2021-06-06
得票数 2
1
回答
无法对
内容
复制设置为不允许的
PDF
文件执行
OCR
、
、
、
由于安全原因,我无法上传
PDF
文件,但可以创建一个
内容
复制设置为不允许的
pdf
文件,然后尝试对此文件执行
OCR
。
OCR
返回一个错误,指出文件受密码保护或类似的东西。谁能告诉我有没有一种方法可以对这样的文件执行
OCR
?
浏览 5
提问于2020-07-19
得票数 2
3
回答
将
pdf
的
内容
读取为字符串
、
、
如何将
PDF
的
内容
以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。
PDF
来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。我怎样才能获得这个网页,并阅读网址的
内容
。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.
pdf
, encoding: NSUT
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
2
回答
Powershell和Adobe
、
我们有许多
pdf
文件,它们都是解锁的,它们都有文本、图片等,每次我们必须打开adobe上的文件并手动打开它们时,我想也许有一个更好的方法来处理PowerShell,如果不是的话,我们必须做超过1000个文件
浏览 7
提问于2021-12-22
得票数 -2
回答已采纳
1
回答
如何从
pdf
文件的图像中提取文本?
一切正常,但它不是从
pdf
文件中提取的图像。Tika可以从
pdf
和图像中提取文本,但不能从包含图像的
pdf
中提取文本。我有点困惑。有没有办法做到这一点?是否需要将
PDF
文件转换为图像?
浏览 3
提问于2018-10-11
得票数 1
2
回答
如何通过API网关将AWS Lambda中的"
pdf
“和"html”文件作为“事件”传递?
、
、
、
我试图将"
pdf
“或"html”文件直接传递到lambda函数中。但是我不明白它应该以什么正确的格式接收?我能够理解如何使用以下代码通过lambda函数传递“图像”文件:但是如何发送
pdf
或html文件呢?(img): return
ocr
_text except Ex
浏览 1
提问于2020-05-06
得票数 0
回答已采纳
1
回答
使用GNU并行组合两个命令用于
OCR
项目
、
、
、
、
在编写文本文件之后,我想编写一个脚本,它运行一个命令到
OCR
pdfs,它删除结果图像。time find .所以,
编辑
: 解决问题
浏览 1
提问于2017-07-11
得票数 1
1
回答
如何下载谷歌扫描的.
pdf
OCRed?
、
我有一个电子邮件与扫描的.
pdf
附加在我的Gmail帐户。当我点击“查看”,我看到谷歌有OCRed它。当我单击“下载”时,
PDF
是原始的,即不包含OCRed。如何通过谷歌下载
内容
为.
pdf
的OCRed文件?
浏览 0
提问于2012-11-26
得票数 2
2
回答
如何在
pdf
文件中复制图像中的文本?
、
、
我可以使用evince文档查看器使用文本查看
pdf
图像,但是我不能选择图像中的文本来复制和粘贴。如何在
pdf
文件中从图像中复制文本?
浏览 0
提问于2014-09-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何编辑pdf文件内容?pdf文件内容怎么编辑?
怎么编辑pdf?快速编辑内容!
pdf文件怎么编辑?pdf怎么修改内容
pdf怎么编辑修改内容?paf编辑内容看这些!
怎么编辑PDF文件内容?教你三招学会PDF格式怎么编辑
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券