腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 删除
PDF
原始文件中
的
/
PDF
-扫描&
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
4
回答
运行反引号/exec()时
的
PHP路径问题
、
、
在这条路径上,他们是空格,这是导致问题
的
原因。即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;endforeach; 如果您可以看到子文件夹名称之间
的
空格,则会导致问题。通过命令行,它将是(这是有效
的</
浏览 1
提问于2010-04-15
得票数 0
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单文件中有这一行,该文件包含用于
PDF
处理
的
许多其他命令:它
的
优点是提供表单MY_
PDF
_
ocr
.
pdf
的
输出文件,从而保留输入文件
的
名称。为此,我可以用这句话: Exec=kon
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
3
回答
更改windows批处理中
的
文件扩展名
、
、
、
到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点
的
扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
1
回答
在r中
的
pdf
上执行
ocr
时出错
、
、
、
、
在r中
的
pdf
上尝试
OCR
,这给了我错误。运行代码后,也会生成"i.txt“文件,但仍然会出现错误。D:/
PDF
_
OCR
_File/test.
pdf
.tif D:/
PDF
_
OCR
_File/test.
pdf
-l eng"' had status 1 6: In shell(shQuote(paste0("D:/Software_for_<em
浏览 3
提问于2017-09-20
得票数 0
1
回答
带有图像
的
PDF
文件
的
OCR
、
、
我让Tika在
PDF
文件上使用Tesseract,但是如果我给它一个同时具有可搜索文本和图像
的
PDF
文件,文本是OCRed两次。有什么办法可以避免这种情况吗?即使它要经过两次,一次是笔直
的
文本,另一次是图像。
浏览 4
提问于2020-12-31
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描
的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描
的
PDF
中提取文本(具有不可选文本
的
图像)。我想要
的
信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
更新多个列,使其与另一列相等
、
我有一个要更新
的
表。在我
的
表中,如果一列有重复项,则将其与其匹配项分组在一起。其中一份文件是原件。我需要更新我
的
表,以使组Id等于原始文档。因此,如果所有文档属于同一组,则它们必须具有相同
的
统一标题。例如,
OCR
0000000006和
OCR
0000000008都有统一
的
标题06000146.
pdf
。94 06000847.
pdf
OCR
0000000004
OCR
0000000006
浏览 0
提问于2014-03-22
得票数 0
1
回答
两种输入文件类型同时在GNU并行?
、
、
、
-l deu_frak && rm {.}.pgm' 这是我按照Ole Tange
的
建议尝试过
的</em
浏览 2
提问于2017-07-25
得票数 1
3
回答
将
pdf
的
内容读取为字符串
、
、
如何将
PDF
的
内容以字符串
的
形式快速读取。我想稍后过滤这个字符串并从中获取特定
的
文本元素。
PDF
来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。我怎样才能获得这个网页,并阅读网址
的
内容。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.
pdf</e
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
1
回答
检测景观格式
的
图像,并将其分割成两幅肖像。
、
、
、
、
我已经扫描了
PDF
格式
的
文件。这些文件包含一页纵向格式和两页横向格式
的
页面。 我需要对它们执行
OCR
处理,但我需要使用bash脚本重新格式化它们。我可以用pdfimages从
PDF
中提取图像,将它们与img2
pdf
放在一起,用ocrmypdf执行
OCR
处理。但是,我很难用
的
实用程序来检测它们
的
方向,如果必要的话,在纵向模式下将它们分割成两幅图像。你应该知道,并不是所有的扫描都是相同
的
大小和肖像和景观图像混合在同一个<
浏览 2
提问于2020-04-20
得票数 1
1
回答
如何使用Apache Tika Server从
PDF
中提取内联图像并将其保存为文件?
、
我在对http://localhost:9998/tika
的
PUT请求中使用了以下标头"X-Tika-OCRLanguage", "eng""X-Tika-PDFOcrStrategy", "no_
ocr
浏览 48
提问于2021-06-02
得票数 0
1
回答
将扫描
的
pdf
转换为R中可搜索
的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。我有使用tabulizer抓取可读
的
pdfs
的
经验,但我以前从未真正使用过扫描pdfs,tabulizer无法读取它们。环顾在线,我所能得到
的
最远就是将扫描
的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大
的
变化,因此表中
的
列都错对齐了,并出现了无序。即使它
的
格式仍然很好,我也不知道如何将字符对象转换成最终
的
df
浏览 5
提问于2022-11-16
得票数 0
2
回答
在WinForm中寻找
OCR
库
、
、
是否有任何免费/付费
的
OCR
库能够捕获
PDF
格式
的
发票数据?需要有一个低
的
错误率。我们需要对这些数据进行进一步
的
处理。
浏览 0
提问于2019-06-10
得票数 1
1
回答
如何从
PDF
中提取音乐符号?
、
、
、
我试图用另一种内置字体渲染
PDF
格式
的
音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
2
回答
用R做
OCR
、
、
、
、
我一直试图在R内做
OCR
(读取
PDF
数据作为扫描图像)。一直在读到这个@ lapply(myfiles, function(i){ # convert
pdf
to ppm (an image format), just pages 1
浏览 7
提问于2015-08-13
得票数 14
1
回答
如何在perl中安装
PDF
::
OCR
2模块?
、
、
、
我正在尝试使用perl从扫描
的
PDF
中获取文本,所以我在perl中使用了
PDF
::
OCR
2模块,但我无法安装此模块,安装Image::
OCR
::Tesseract模块失败,我使用
的
是CentOS7,这是我在安装过程中
的
错误NOT OK reports LEOCHARRE/
浏览 17
提问于2016-08-19
得票数 0
2
回答
如何向只包含图像
的
PDF
中添加文本?
、
我使用像富士通iX500 ScanSnap扫描仪这样
的
硬件解决方案进行实时扫描,同时使用Foxit PhantomPDF向
PDF
中
的
图像添加文本。这两种解决方案都带来了不错
的
OCR
,但是也有一些缺陷,比如在非文本上出现错误,或者99%
的
文本在页面上被漏掉,因为页面的角落中有3-4个单词与页面上
的
所有其他文本一样,它们都是90度旋转
的
。至少PhantomPDF允许您检查软件认为可能是假阳性
的
内容,但您没有太多
的
控制能力
浏览 0
提问于2018-05-25
得票数 0
2
回答
如何将
pdf
格式转换为eBook格式
、
是否有方法将
PDF
文档转换为eBook格式,如epub、azw或mobi?我正在寻找一个应用程序,这是快速
的
转换。我刚试过口径。10分钟后,甚至没有达到2%
的
转换。所以请不要有口径。CLI是首选。
浏览 0
提问于2013-04-26
得票数 9
回答已采纳
1
回答
执行
OCR
时出错- Microsoft Azure Computer Vision API
、
我正在使用Microsoft Azure Computer Vision进行
OCR
PDF
提取。当我尝试执行
OCR
时,它给出
的
错误为 Read
PDF
With
OCR
: Error performing
OCR
: MicrosoftAzureComputerVisionErrorRunEngine
浏览 31
提问于2020-07-01
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
告别「复制+粘贴」,基于深度学习的OCR,实现PDF转文本
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
pdf识别软件哪些好用?分享超级实用的一款ocr识别软件!
[windows] Umi-OCR 免费 · 离线 · 文字识别软件 支持PDF识别 开源
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券