腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9091)
视频
沙龙
1
回答
如何
通过
OCR
将
扫描
的
PDF
转
换为
Excel
?
python
、
python-3.x
、
ocr
、
tesseract
我使用
的
代码是: import osimport subprocess 8 ['tesseract', path, 'stdout'], 9 stdout=subprocess.PIPE,' 我有一张
扫描
过
的
各种名片
的
<e
浏览 19
提问于2019-10-18
得票数 0
1
回答
如何
将
jpg文件目录转
换为
以文件名为书签
的
pdf
?
pdf
、
pdftk
、
bookmarks
我有一个目录
的
jpg文件,是
扫描
我
的
手写笔记。
如何
将它们转
换为
一个
将
文件名作为书签
的
pdf
文件? (我最终也想加入
ocr
。如前所述,我们可以使用.jpg
将
.
pdf
文件转
换为
img2
pdf
.jp --output combined.
pdf
,然后可以使用ocrmypdf combined.
pdf
combined_
ocr<
浏览 0
提问于2021-09-23
得票数 0
1
回答
从可搜索
的
pdf
中读取,不带
ocr
pdf
我目前正在使用
扫描
仪将我
的
PDF
转
换为
可搜索
的
PDF
。
OCR
已经处理好了,因为我可以在
PDF
中使用ctrl-f。 但是,我
如何
才能从我
的
程序中获取
OCR
的
内容。我对使用java和ruby持开放态度,这个问题是编程语言不可知
的
。是否可以
通过
读取文件来公开访问
OCR
文本?
浏览 1
提问于2011-12-15
得票数 0
1
回答
将
扫描
的
pdf
文件转
换为
文本可搜索
的
pdf
文件
php
、
pdf
、
ocr
我想将
扫描
的
pdf
文件转
换为
可文本搜索
的
pdf
文件。我想给出一个输入作为
扫描
的
PDF
,然后我
的
预期输出是可搜索
的
PDF
。有几个工具,给我们
的
文本作为输出从
扫描
的
pdf
文件,但我想文本可搜索
的
pdf
文件作为输出,而不仅仅是文本。我搜索了一下,找到了一个解决方案,但我
的<
浏览 25
提问于2017-07-09
得票数 1
3
回答
如何
使用任何Java库使现有的
PDF
文本可搜索?用
OCR
java
、
ocr
、
pdfbox
如何
使用任何java库生成可搜索
的
文本?开源或付费。
如何
使用PDFBox
将
OCR
应用于
pdf
?
如何
使
pdf
文本可编程搜索使用pdfbox,我搜索了很多。没有找到任何解决办法。有人能粘贴
OCR
PDFBox
的
代码吗?
浏览 8
提问于2014-04-04
得票数 0
回答已采纳
2
回答
袖珍式收据
扫描
器
scanner
、
portable
我在找口袋大小
的
扫描
仪来
扫描
收据.我指的是那些印在销售点热变色纸卷上
的
收据.我知道你可以使用智能手机加上一些应用程序,但我发现这里有一些主要
的
缺点:很难找到正确
的
角度(尤其是当你一整天都在前进
的
时候),默认有损压缩格式(为图片设计)会给
OCR
带来以后
的
麻烦,
扫描
的</e
浏览 0
提问于2015-09-13
得票数 9
回答已采纳
1
回答
如何
将
pdf
文件从灰度转
换为
黑白?
command-line
、
pdf
我
的
操作系统是Ubuntu12.04。
如何
将
pdf
文件从灰度转
换为
黑白?灰度
pdf
文件来自于带有灰度选项
的
扫描
,并且
OCR
需要黑白等级
pdf
。更新: 根据Marco
的
答复,B
pdf
不是很好,原始文件是这里。
浏览 0
提问于2013-07-28
得票数 13
2
回答
GCP
OCR
服务-
将
扫描
的
PDF
或图像转
换为
可搜索
的
PDF
google-cloud-platform
、
ocr
是否可以使用Google平台
的
OCR
将
扫描
的
PDF
转
换为
新
的
可搜索
PDF
文件?
浏览 2
提问于2018-01-24
得票数 0
2
回答
PDF
和文本层
pdf
、
ocr
、
scanning
根据这个站点
的
,当添加一个文本层时,
PDF
是可搜索
的
。如果
扫描
仪在图像上执
浏览 2
提问于2012-07-10
得票数 15
回答已采纳
2
回答
有没有可能把
pdf
转换成文本?
android
、
pdf
在我
的
应用程序中,我从网上下载了
pdf
文件。在Android中可以
将
pdf
文件转
换为
文本(字符串或字符)吗?
浏览 0
提问于2011-08-26
得票数 3
回答已采纳
1
回答
使用Ghostscript
将
扫描
的
PDF
转
换为
纯文本
pdf
、
tesseract
、
ghostscript
我知道有一种方法可以使用
将
scannedPDF文档转
换为
OCR
'd
PDF
文档,使用以下命令:它使用开源来做到这一点。根据,它可以转换成另一个
PDF
文档,而不仅仅是简单
的
文本(而tesseract也可
浏览 1
提问于2021-03-04
得票数 0
2
回答
如何
将
pdf
扫描
图像转
换为
最适合
ocr
的
高分辨率tiff?
pdf
、
imagemagick
、
tiff
我转换
pdf
到tiff图像与图像魔术,从500 to到4.6mb
的
文件大小。convert \pph-psd.tiffTiff图像: 为什么会发生这种情况,以及
如何
将
pdf
扫描
图像转
换为
最适合
ocr
浏览 1
提问于2018-05-16
得票数 0
回答已采纳
2
回答
用于去除暗
扫描
边距
的
PDF
编辑软件
pdf
、
automation
、
image-editing
假设您有一个
PDF
文件,该文件是由一本书
的
多页
扫描
(以小于
扫描
仪默认格式
的
格式(例如,10 on×20 on和DIN A4)产生
的
),并且
扫描
该图书的人在
扫描
仪上
的
任意位置。有没有一种工具允许从一页到另一页,并根据程序
的
建议删除黑暗边距(我不想在此之后使用任何类型
的
编辑工具,也许可以更正建议,但不
浏览 0
提问于2014-07-08
得票数 7
1
回答
如何
提取
pdf
格式
的
表列数据并存储在变量python中
python
、
python-3.x
、
regex
、
pypdf2
、
python-camelot
我有3个表(图像粘贴),所有3个表(有相同
的
列)看起来都一样,我希望在变量中存储3个表
的
地址列(黄色)
的
数据。
浏览 8
提问于2022-02-16
得票数 -1
3
回答
如何
在没有microsoft.office.interop
的
情况下
将
PDF
转
换为
文档?
c#
、
pdf-generation
、
ms-office
、
openoffice.org
、
doc
我需要转换成.doc文件使用C#
的
PDF
文件。虽然这台计算机没有安装Office,但它没有文件系统。有没有什么好办法让我这么做呢?我做了一些研究,大多数人都在使用互操作服务。
浏览 2
提问于2011-04-23
得票数 0
回答已采纳
1
回答
使用从
扫描
PDF
批量生成
的
OCR
创建可搜索
的
PDF
文件
pdf
、
ocr
其目标是自动
将
所有
扫描
文档转
换为
可搜索
的
PDF
文件,而不仅仅是图像。
扫描
后
的
文档由
扫描
仪自动上传到Linux服务器上
的
共享文件中,作为
PDF
文件。该软件应该能够监视文件夹和自动
OCR
扫描
的
文件,并将识别的文本添加到
PDF
文件,使其可搜索。它还应该能够很好地处理多页
PDF
。Linux 在后台自动工作,不需要任何额外<em
浏览 0
提问于2014-04-28
得票数 16
3
回答
OCR
将
扫描
的
pdf
问卷转
换为
记录(csv,数据库)
ocr
、
survey
任务是
将
填写在纸上
的
问卷转换成记录(输出可以是一个csv文件或
excel
表格,在数据库等)进行分析。我试图在网络上找到一个解决方案,但所有出现
的
都是那些想卖给我们scanner+software
的
公司。我们真正需要
的
是软件部分。用户将在屏幕上获取每个表单
浏览 0
提问于2015-10-27
得票数 3
回答已采纳
2
回答
如何
编辑可搜索
PDF
的
搜索文本?
pdf
、
acrobat
我可以访问我
的
图书馆
的
扫描
仪,它可以创建“可搜索
的
PDF
”。这些
PDF
显示
扫描
文档的确切图像,但是当您尝试选择包含文本
的
图像
的
一部分时,
PDF
中有一种隐藏
的
文本可以被选择。
通过
这种方式,您可以在
扫描
文档中复制和粘贴文本或搜索文本。这很有用。这是一个可怕
的
改进比原始
扫描
图像。我
的
mac上也有几个应用程序,可以从<
浏览 6
提问于2015-10-02
得票数 1
1
回答
使用pytesseract python从
扫描
的
PDF
中将表格提取为csv
python
、
python-3.x
、
python-tesseract
我有不同类型
的
发票文件,我想在每个发票文件中查找表。我可以使用'
pdf
2jpg‘方法
将
扫描
的
pdf
转
换为
图像,现在我必须从每张发票中提取表格,并使用
OCR
pytesseract方法写入csv文件。
浏览 34
提问于2020-01-14
得票数 0
2
回答
如何
将
PDF
转
换为
JSON/
EXCEL
/WORD文件?
java
、
excel
、
pdf
、
ms-word
、
ocr
我需要从
pdf
文件中获取数据及其标头,以便进一步与DB数据进行比较 我试着使用pdfbox,google vision
ocr
,itext,但是所有的库都没有结构和头文件。示例: Date\nNumber\nStatus\n12\12\2020\n442334\delivered 我会尝试
将
pdf
转
换为
excel
/word并从中获取数据,但为了实现这一点,我需要读取
pdf
并将数据写入
excel
/word。
如何
获取带
浏览 54
提问于2020-04-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何将图片文件转换为PDF文档-图片转PDF的方法分享
如何将已有的EXCEL文件高效转换为PDF格式的文件?
如何将pdf转换为excel的格式?只需三个方法
如何pdf转excel在线?三种方法帮小白解决问题
怎么将pdf转换excel?三种小白也能快速掌握的方法
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券