腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
OCR
将覆盖HTML传输到图像?
、
我要找一个
OCR
软件
,渲染覆盖HTML到一个图像。我目前正在使用一些未命名的产品。它有一个
OCR
功能,可以对带有图像的
PDF
文档进行内联
OCR
。内联
OCR
非常方便,它允许搜索带有图像的
PDF
文档中的文本。也可以直接在文档中突出显示文本,
OCR
文本与底层图像对齐。不幸的是,我无法从未命名的产品中导出或存储内联
OCR
。有没有其他
软件
可以执行和导出在线
OCR
?我特别感兴趣的是导出到HTML中,其中包含与底
浏览 3
提问于2013-05-13
得票数 5
7
回答
如何将
pdf
转换成文本可搜索的
pdf
?
、
、
我有一些扫描文件的
pdf
,我想能够搜索他们。我怎么能这么做?治夹心三明治 (
软件
中心说它是一个很差的
软件
包,我不应该安
浏览 0
提问于2014-05-29
得票数 36
回答已采纳
1
回答
使用PHP或JS解析扫描的
PDF
文件的最佳方式是什么?
、
、
我有一个翻译网站,我想解析
PDF
文件,以便我可以计算字数和我设定的翻译价格。 我以前试过Poppler JS。但它不能处理扫描的文件。我该如何处理它们呢? 例如,此
PDF
是一篇扫描的文章。这是一个
PDF
文件,但每一页都是一张图片,我需要提取文本: ?
浏览 22
提问于2020-12-13
得票数 0
回答已采纳
11
回答
免费的
OCR
软件
,使
PDF
可搜索(与可搜索的文本在正确的地方)
、
、
、
、
是否有任何免费的
OCR
软件
(用于Linux和/或Windows)可以像Acrobat那样将
PDF
扫描文档作为输入并输出可搜索的
PDF
?使用可搜索的
PDF
格式,我的意思是OCRed文本在原始文本上是不可见的,可以用鼠标选择并复制。我知道Linux上的gscan2
pdf
可以这样做,但是文本被放置在页面的左上角,而且太小了,与背景扫描页面上的文本完全不同步。这是因为gscan2
pdf
将整个页面提供给
OCR
引擎。它应该将图像分解成小图像,用单行文本或
浏览 0
提问于2014-04-20
得票数 72
回答已采纳
1
回答
在子文件夹中批处理
OCR
文件,并以新名称保存新文件
、
、
、
、
OCR
运行正常,但我希望将
OCR
‘’ed文件重命名为:<parent folder path>-<filename>_ocred.
pdf
。以这种方式命名它们将不会产生任何文件覆盖。当前,代码
OCR
是文件,但它将新文件保存到它们所在的文件夹之上的文件夹中。它还将文件名保存为"JAN_ocred.
pdf
",例如,对于名为"JAN.
pdf
“的文件。此外,
OCR
‘’ed文件是否保留在un文件所在的文件夹中也不重要,或者它们是
浏览 2
提问于2021-06-09
得票数 0
回答已采纳
1
回答
在谷歌翻译中粘贴时,重音显示与字母分开?
、
、
、
我有一个
pdf
文件,我想翻译成英语。当我将文本从
pdf
文件复制到Google翻译时,重音与字母是分开的,因此Google无法识别它。
浏览 0
提问于2014-04-25
得票数 0
3
回答
将扫描的
PDF
转换为可搜索的
PDF
( R)
、
、
、
、
我正在尝试使用tesseract和pdftools包将一系列扫描的
PDF
转换成可搜索的
PDF
。我已经完成了两步。现在我需要写回一个可搜索的
pdf
。读取扫描
PDF
eg <- download.file("https://www.fujitsu.com/global/Images/sv600_c_automatic.
pdf
", "exa
浏览 22
提问于2021-09-01
得票数 1
1
回答
我想从
OCR
数据中提取表信息。
、
、
、
我想从
OCR
数据中提取表格信息,我有原始文本和它的文本。我试过pytesseract,但找不到实际的实现。我试过这个: 这种方法对我一点用也没有。我希望从
OCR
数据中获得此表的表格结构,以供进一步处理。
浏览 3
提问于2019-01-20
得票数 0
2
回答
PDF
阅读器有可能读取不同字体的文件
、
是否有
PDF
阅读器可以将字体从一种字体改为另一种字体(只是为了便于阅读)。它不需要修改
PDF
文件的原始字体,只是在读取时更改。📷
浏览 0
提问于2016-09-28
得票数 2
10
回答
光学字符识别
软件
推荐?
我想直接扫描的版本一定是由一些光学字符识别
软件
处理的。谢谢和问候! 请每个答案限制一个
软件
。
浏览 0
提问于2010-10-22
得票数 15
回答已采纳
1
回答
iTextSharp GetTextFromPage只返回第一页
、
我使用的是iTextSharp版本5.5.12 string strPageText = PdfTextExtractor.GetTextFromPage(
Pd
浏览 0
提问于2017-09-26
得票数 0
回答已采纳
1
回答
从
PDF
获取数据到php/html/javascript
、
、
我想问一下大家对
pdf
的看法。例如,这张图片,这样您就可以看到我想从
pdf
:输出哪些数据 谢谢
浏览 1
提问于2013-05-08
得票数 0
回答已采纳
1
回答
从
PDF
中获取树的文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个
PDF
()中的树。文件的名称将是左边对应的树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。我怎样才能从这个
PDF
中获取我想要的文件呢?能用Python完成吗?还有更简单的方法吗?或者,我获得
PDF
的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4#r#h NP#1#5#l#s NP
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
1
回答
无法从Gscan2
PDF
进行13.10扫描或使用Tesseract进行
OCR
扫描
、
在我最喜欢的开源
软件
中,我遇到了一点麻烦。我在我的13.10 64位机器上安装了来自
软件
中心的Gscan2
PDF
(1.0.4) (清洁安装从13.04开始,备份从Deja )。然而,Gscan2
PDF
不会扫描,我必须使用简单的扫描,然后打开
PDF
到
OCR
它与Gscan2
PDF
。这不是理想的,但不是一个交易的破坏者,对我来说,主要的问题是,当我选择
OCR
,Tesseract不是一个选择。谁能帮我让Gscan2
PDF
按应有的方式工作吗?
浏览 0
提问于2013-11-12
得票数 2
回答已采纳
1
回答
将abbyy XML转换为可读格式
、
、
、
这个XML似乎是Abbyy程序的输出(大概是基于实际书籍的
OCR
)。网络搜索是无用的,因为它只是带来无穷无尽的结果,要么使用Abbyy商业
软件
,要么转换成XML,或者从
PDF
,或者做
OCR
。
浏览 0
提问于2019-04-15
得票数 1
1
回答
如何从扫描的
PDF
中提取表格数据?
、
、
、
、
我创建了一个Java项目,它在解析具有特定结构的可搜索
PDF
方面相当成功。其中的表很复杂,有合并的行或列,但在每个这样的
PDF
中,表的结构保持不变,只有内部的文本发生变化。我能够克服所有这些挑战,配备了PDFBox、
PDF
2Dom和Tabula。 然而,昨天当我收到一套新的
PDF
扫描时,问题就出现了。扫描后,整个内容都是图像,无法搜索。出于对
OCR
的需求,我开始研究Tesseract。然而,我发现只有使用它,才会在没有任何上下文的情况下把
PDF
的整个文本内容拿出来,复选框就会丢失。所以我
浏览 1
提问于2018-10-25
得票数 1
1
回答
快速检查
PDF
文件上的
OCR
文本层
、
有没有什么程序可以让我在
PDF
渲染的基础上叠加
PDF
的文本(
OCR
)层?如果这可以用程序来完成,那会更方便,如果不能,一些cli命令或脚本也可以工作。
浏览 2
提问于2017-11-18
得票数 1
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
使用pypdfocr的Alfresco上的
OCR
文件
、
、
、
、
我不能在Alfresco上使用pypdfocr的
OCR
文件。我已经完成了所有必要的配置,在各自的文件夹中添加了文件repo.jar和share.jar:/opt/alfresco-community/modules/shar
浏览 9
提问于2020-08-30
得票数 0
回答已采纳
3
回答
OCR
图形纸
我想把一个扫描过的图形纸笔记本(有手写)的
pdf
格式转换成一个文本文件。谢谢
浏览 6
提问于2009-06-20
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
对PDF进行ocr文字识别怎么操作?扫描识别软件推荐
pdf识别软件哪些好用?分享超级实用的一款ocr识别软件!
[windows] Umi-OCR 免费 · 离线 · 文字识别软件 支持PDF识别 开源
OCR识别软件,有什么可以ocr识别的软件
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券