腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
扫描
pdf
至doc
有没有人知道是否有一个免费的在线
OCR
转换器
,可以转换大扫描的
pdf
文件(例如,我想转换一个扫描的28 of大小的
pdf
文档)? 我试过很多
ocr
转换器
,但都失败了。
浏览 0
提问于2016-01-17
得票数 0
2
回答
如何将
pdf
格式转换为eBook格式
、
是否有方法将
PDF
文档转换为eBook格式,如epub、azw或mobi?我正在寻找一个应用程序,这是快速的转换。我刚试过口径。10分钟后,甚至没有达到2%的转换。所以请不要有口径。CLI是首选。
浏览 0
提问于2013-04-26
得票数 9
回答已采纳
1
回答
高新ECM含量转换
我使用Alfresco将TIFF转换为
PDF
,使用Tiger
OCR
库()<?BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'> <bean id="transformer.
Ocr
.Tiff2
Pdf
调试u
浏览 1
提问于2011-04-15
得票数 0
2
回答
如何向只包含图像的
PDF
中添加文本?
、
我使用像富士通iX500 ScanSnap扫描仪这样的硬件解决方案进行实时扫描,同时使用Foxit PhantomPDF向
PDF
中的图像添加文本。这两种解决方案都带来了不错的
OCR
,但是也有一些缺陷,比如在非文本上出现错误,或者99%的文本在页面上被漏掉,因为页面的角落中有3-4个单词与页面上的所有其他文本一样,它们都是90度旋转的。最先进的
OCR
解决方案是将图像转换为可搜索的
PDF
,还是将(隐藏的)文本添加到仅包含图像的现有
PDF
中(添加搜索功能)?
浏览 0
提问于2018-05-25
得票数 0
1
回答
Python
OCR
Sudoku图像
、
我需要使用
ocr
来转换sudoku图像上的数字,并将其作为网格读取。
浏览 3
提问于2022-06-16
得票数 0
1
回答
关于一个好的自由软件/网站将
pdf
转换为EPUB的建议
、
我发现,当我将一个包含大量文本的
pdf
文件转换成EPUB格式(例如书籍)时,它们会在同一句话之间被分割成段落,我使用过-量程,Toepub.com和许多在大坏网站上可以找到的网站;-)。
浏览 0
提问于2019-11-14
得票数 0
1
回答
以编程方式搜索多个
PDF
文档以获得一系列关键字
问题keyword-set-1 = "foo" "bar";和一个
PDF
文件,其中包含以下文本 "jon doe and然而,我还没有找到一个
PDF
文件的解决方案。我考虑过使用
PDF
矿工将所有
PDF
转换
浏览 4
提问于2014-02-15
得票数 0
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
3
回答
有没有办法制作一个无法转换成word的
pdf
?
、
、
、
我们有一个生成
PDF
文件的系统。但是任何人都可以使用在线
pdf
to word
转换器
来转换这些文件。在Yii或PHP中有什么选项可以阻止这种情况吗?
浏览 0
提问于2016-03-07
得票数 0
4
回答
运行反引号/exec()时的PHP路径问题
、
、
即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;java -jar /
OCR
/
ocr
.jar /Folder/Sub\ Folder/filetoocr.
pdf
/
浏览 1
提问于2010-04-15
得票数 0
1
回答
简单的
OCR
。从
PDF
文件中提取文本并使用它启动工作流
、
我将与
pdf
三明治和tesseract
OCR
结合使用。我希望从插入到文件夹的文档中获取文本,然后在新的工作流中使用文本和
pdf
文件。我已经成功地完成了
OCR
提取,以及如何使用插入目录的文件启动工作流,但是我无法从文件中获取文本并在工作流中使用它。我从哪里开始实现这个功能? 你好,拉法ł
浏览 2
提问于2017-05-09
得票数 1
回答已采纳
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出文件,从而保留输入文件的名称。为此,我可以用这句话: Exec=konsole --noclose -e ocrmypdf "%u&
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
2
回答
从给定坐标提取
PDF
文本
、
、
我想使用Ghostscript从
PDF
的一部分(使用坐标)提取文本。 有人能帮我吗?
浏览 3
提问于2011-05-31
得票数 45
1
回答
在r中的
pdf
上执行
ocr
时出错
、
、
、
、
在r中的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。'"D:/Software_for_
PDF
_
OCR
/xpdf-tools-win-4.00/bin64/pdftoppm.exe D:/
PDF
_
OCR
_File/test.
pdf
-f 1 -lD:/
PDF
_
OCR
_File/t
浏览 3
提问于2017-09-20
得票数 0
3
回答
更改windows批处理中的文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
1
回答
带有图像的
PDF
文件的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
3
回答
如何读取已扫描内容中的内容?
、
我有一些扫描的内容项目,被扫描仪扫描&转换成
pdf
/图像,最后被存储在alfresco存储库中。 我可以使用元数据属性搜索这些扫描的项目,但任何人都可以帮助我如何通过存储在扫描文档中的内容来搜索它们。
浏览 5
提问于2013-12-10
得票数 0
回答已采纳
1
回答
更新多个列,使其与另一列相等
、
例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。
OCR
0000000001 Yes 100 06000093.
pdf
OCR
0000000004
OCR
0000000006 No 95
浏览 0
提问于2014-03-22
得票数 0
1
回答
两种输入文件类型同时在GNU并行?
、
、
、
然后它将使用tesseract对每个pgm (第二个输入文件类型)执行
OCR
。 export -f generate_pgm PGM="$1" find .{}; parallel --argsep ,,,
ocr
,,, pgm/*.pgm'
浏览 2
提问于2017-07-25
得票数 1
点击加载更多
相关
资讯
pdf转换器,分享好用的pdf转换器
pdf转换器有哪些 pdf转换器介绍
PDF转换器
哪些PDF转换器功能多?PDF转换器安利
什么pdf转换器好用?四款pdf转换器推荐
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券