腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何将
jpg
文件
目录转
换为
以
文件
名为书签的
pdf
?
pdf
、
pdftk
、
bookmarks
我有一个目录的jpg
文件
,是扫描我的手写笔记。
如何将
它们转
换为
一个将
文件
名作为书签的
pdf
文件
? (我最终也想加入
ocr
。如前所述,我们可以使用.jpg将.
pdf
文件
转
换为
img2
pdf
.jp --output combined.
pdf
,然后可以使用ocrmypdf combined.
pdf
combined_
ocr
.
pdf
添
浏览 0
提问于2021-09-23
得票数 0
2
回答
为什么我用魔杖从
pdf
中提取图像jpg,它会在文本上变成黑色背景?
python
、
ocr
、
rgb
、
cmyk
、
wand
我对一些
pdf
文件
有问题。我需要将它们转
换为
jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在word转
换为
pdf
文件
的
文件
中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?原页
pdf
? 已将<
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
1
回答
带有
OCR
松散
OCR
的ps2
pdf
ghostscript
我已经寻找了大量的时间来转换ps2
pdf
与
OCR
。所发生的事失去了
OCR
。
pdf
2ps test.
浏览 1
提问于2020-05-26
得票数 1
回答已采纳
1
回答
如何将
pdf
文件
从灰度转
换为
黑白?
command-line
、
pdf
如何将
pdf
文件
从灰度转
换为
黑白?灰度
pdf
文件
来自于带有灰度选项的扫描,并且
OCR
需要黑白等级
pdf
。根据Marco的答复,B
pdf
不是很好,原始
文件
是这里。
浏览 0
提问于2013-07-28
得票数 13
3
回答
如何使用任何Java库使现有的
PDF
文本可搜索?用
OCR
java
、
ocr
、
pdfbox
如何使用PDFBox将
OCR
应用于
pdf
?如何使
pdf
文本可编程搜索使用pdfbox,我搜索了很多。没有找到任何解决办法。有人能粘贴
OCR
PDFBox的代码吗?
浏览 8
提问于2014-04-04
得票数 0
回答已采纳
1
回答
将扫描的
pdf
转
换为
R中可搜索的
pdf
r
、
pdf-scraping
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。即使它的格式仍然很好,我也不知道
如何将
字符对象转换成最终的df。 有没有一种方法可以将扫描的
pdf
转换成可读的
pdf
,这样我就可以在tabulizer中抓取它了?
浏览 5
提问于2022-11-16
得票数 0
1
回答
将
pdf
转
换为
图像,但在放大后
image
、
pdf
、
ocr
、
python-tesseract
、
poppler
此link显示
如何将
pdf
%s转
换为
图像。有没有办法在转换成图片之前缩放我的
pdf
?在我的项目中,我将
pdf
%s转
换为
png%s,然后使用Python-tesseract库提取文本。我注意到,如果我缩放
OCR
s,然后将部分保存为pngs,那么
pdf
会提供更好的效果。那么有没有办法在转换成png之前缩放
pdf
文件
呢?
浏览 41
提问于2019-03-23
得票数 6
回答已采纳
7
回答
如何将
pdf
转换成文本可搜索的
pdf
?
software-recommendation
、
pdf
、
ocr
我有一些扫描
文件
的
pdf
,我想能够搜索他们。我怎么能这么做?治夹心三明治 (软件中心说它是一个很差的软件包,我不应该安装它) OCRfeeder (在软件中心)很好地导出到odt,但在导出到
pdf<
浏览 0
提问于2014-05-29
得票数 36
回答已采纳
1
回答
从
PDF
中获取树的
文件
(最好使用Python)
python
、
pdf
、
tree
、
nlp
、
extraction
我想制作一系列
文件
,其中包含了这个
PDF
()中的树。
文件
的名称将是左边对应的树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。我怎样才能从这个
PDF
中获取我想要的
文件
呢?能用Python完成吗?还有更简单的方法吗?或者,我获得
PDF
的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4#r#h NP#1#5#l#s NP
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
1
回答
PDF
实时下载和转换
google-apps-script
、
google-sheets
、
google-drive-realtime-api
我正在寻找一种方法,使用谷歌应用脚本下载
PDF
文件
,并转换成谷歌工作表的
文件
。 这是因为网站只提供
PDF
格式的数据,而我不能使用导入功能来获取数据以进行实时更新
浏览 7
提问于2021-06-10
得票数 0
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转
换为
可搜索的
PDF
?
pdf
、
google-apps-script
、
ocr
、
drive
我想使用Google 将不可搜索的
PDF
转换成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传
文件
到另一个网站或下载的
文件
,以进行转换。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat如何进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们转换成文本或文档
文件
。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
11
回答
免费的
OCR
软件,使
PDF
可搜索(与可搜索的文本在正确的地方)
windows
、
gratis
、
linux
、
pdf
、
ocr
是否有任何免费的
OCR
软件(用于Linux和/或Windows)可以像Acrobat那样将
PDF
扫描文档作为输入并输出可搜索的
PDF
?使用可搜索的
PDF
格式,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。我知道Linux上的gscan2
pdf
可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景扫描页面上的文本完全不同步。这是因为gscan2
pdf
将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或小段落发送到<em
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
2
回答
ITextSharp在C#中无法读取
pdf
中的文本
c#
、
pdf
、
itextsharp
我有两个
pdf
文件
。在Sercurity选项卡上,两个
文件
都设置了Security方法:无安全性和文档程序集:不允许,页提取:不允许。其他项目是允许的。我使用standart ITextSharp方法从
pdf
中检索文本: for,我可以从第二个
文件
中得到currentText的任何问题,我无法检索文本,currentText是空的。我在SodaPDF中打开了这个
文件</e
浏览 4
提问于2014-05-21
得票数 0
回答已采纳
2
回答
用php读取
PDF
文件
php
、
codeigniter
除了我无法读取我的
pdf
文件
之外,一切都很顺利。当我尝试阅读时,它会下载或保存它。我尝试了很多解决方案,但都没有奏效。$name; header('Content-Disposition: inline; filename
浏览 1
提问于2017-07-20
得票数 0
回答已采纳
1
回答
如何将
pdf
文件
转
换为
ocr
pdf
文件
python
、
ocr
我有一个问题,我需要转换一个
pdf
文件
到
OCR
pdf
文件
,就像Adobe Acrobat的工作方式。我已经尝试过使用ocrmypdf模块,但不知何故它不起作用。我使用的是python 2.7。loggingimport subprocessimport time print (filename) inpu
浏览 13
提问于2019-02-12
得票数 0
3
回答
更改windows批处理中的
文件
扩展名
windows
、
file
、
batch-file
、
rename
我正在尝试重命名很多
文件
。到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
2
回答
如何将
pdf
扫描图像转
换为
最适合
ocr
的高分辨率tiff?
pdf
、
imagemagick
、
tiff
我转换
pdf
到tiff图像与图像魔术,从500 to到4.6mb的
文件
大小。convert \pph-psd.tiffTiff图像: 为什么会发生这种情况,以及
如何将
pdf
扫描图像转
换为
最适合
ocr
浏览 1
提问于2018-05-16
得票数 0
回答已采纳
1
回答
将多个
PDF
文件
转
换为
文本(R语言)
r
、
pdf
、
dplyr
、
tesseract
我正在使用R中的"tesseract“库将"
PDF
文件
转
换为
文本”,如下所示:library(tesseract) text <- tesseract::
ocr
(pngfile)上面的代码运行得很好。现在,我正在尝试“批量上传”大量
PDF
<
浏览 4
提问于2021-07-31
得票数 0
2
回答
如何区分扫描的
PDF
和常规的文本
PDF
r
、
pdf
、
tesseract
我正在处理多个
PDF
文件
的
OCR
任务。其中一些是扫描的(不可搜索的),另一些只是原生的(可搜索的)
PDF
。image1 = image_read_
pdf
(file.list1[1], density=150)用于文本的
pdf
text1 =
pdf</em
浏览 7
提问于2021-04-10
得票数 1
4
回答
一种基于
OCR
的
PDF
文本提取方法
java
、
pdf
、
text-parsing
是否有人尝试过使用
OCR
库和Java从
PDF
中提取文本?你认为什么是最可靠的文本提取库?我见过的大多数方法(tesseract、GOCR)都是C库,需要编写一些JNI代码。
浏览 2
提问于2009-04-22
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何将图片文件转换为PDF文档-图片转PDF的方法分享
如何将已有的EXCEL文件高效转换为PDF格式的文件?
WORD怎么转换为PDF?WORD文档转PDF文件的技巧分享
pdf文件怎么转换为图片?推荐三个pdf转图片方法
如何将CAD文件转换成PDF?dwg转PDF工具推荐
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券