腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3043)
视频
沙龙
1
回答
帮助Canon CanoScan LiDE扫描
PDF
文档
、
、
、
当我使用Windows 7中的扫描仪,并将扫描过的书籍页保存为
PDF
格式时,我可以打开
PDF
扫描页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我通过简单的扫描将页面扫描为文本,并将其保存为
PDF
格式。但是在Ubuntu中,当我打开扫描的
PDF
页面时,它会打开OK,但是我不能复制文本。
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
2
回答
可将
OCR
文本插入回源
PDF
的
OCR
库
、
是否有库(或可执行文件)可以
OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
2
回答
Tesseract
OCR
混淆了0到8的斜线
、
、
我曾在终端字体上训练过tesseract,但无论如何,我都
无法
让它
识别
出0。我正在使用jTessEditor创建培训tif和框。即使在验证时,它也会将所有的0读为8s。我遗漏了什么吗?
浏览 8
提问于2018-10-31
得票数 22
1
回答
关于拆分
PDF
和
OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我知道Python的
PDF
和
OCR
库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给
OCR
,以
识别
字符并将输出转换为csv或文本文件。 提前感谢您……
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
5
回答
是否有
OCR
无法
识别
的字体?
无法
复制文档内容。为此,我将其页面转换为图片,并将其添加回
PDF
文件。主要的问题是,任何
OCR
程序都可以恢复整个书面文本,特别是页面将是清晰的(而不是扫描的书),这将提高
OCR
的准确性。那么,有没有
OCR
无法
识别
的字体呢?否则,有没有一种技术可以让我的文档只被人类阅读,而不被
OCR
识别
?(例如,添加特定的背景,等等) 提前谢谢你。
浏览 3
提问于2012-11-13
得票数 4
回答已采纳
1
回答
如何在蟒蛇的景观方向上阅读
pdf
?
、
、
、
我有一个
pdf
文件,是在肖像方向,但在一些页面,文本是在景观方向。
浏览 1
提问于2018-04-03
得票数 0
回答已采纳
1
回答
如何在PDFTextExtractor上使用iTextSharp
我想用iTextSharp从
pdf
文件中检索文本。但是,我
无法
像在itextsharp(itext)的JAVA中那样使用PDFTextExtractor。私有字符串readPDFOffline(string fileUri);检索此
Pdf
的文本内容;*返回contentOfflineFile
浏览 3
提问于2010-12-10
得票数 3
回答已采纳
1
回答
用c#编程编辑
PDF
(非固定
PDF
)
、
、
、
、
是否可以编辑在C#中不可填充的
PDF
格式 ..。这是来自ASPOSE文本替换的输出。
浏览 6
提问于2012-06-28
得票数 1
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
、
、
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
如何从
PDF
中提取音乐符号?
、
、
、
我试图用另一种内置字体渲染
PDF
格式的音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
iconv.exe -f MAC
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
1
回答
OCR
表格
识别
是否支持Excel表格合并?
浏览 174
提问于2022-06-15
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
OCR
文字
识别
?
浏览 222
提问于2022-06-15
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换为可搜索的
PDF
?
、
、
、
我想使用Google 将不可搜索的
PDF
转换成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传文件到另一个网站或下载的文件,以进行转换。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat如何进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们转换成文本或文档文件。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
3
回答
OCR
图形纸
我想把一个扫描过的图形纸笔记本(有手写)的
pdf
格式转换成一个文本文件。谢谢
浏览 6
提问于2009-06-20
得票数 1
3
回答
运行ImageMagick将低质量
pdf
转换为图像(用于
OCR
)的最佳参数是什么?
、
、
、
、
我有几个低质量的
pdf
。我想使用
OCR
--更准确地说,是用从他们那里获取文本。为此,我使用了first --一个将
pdf
转换为图像的命令行工具--将这些
pdf
转换为jpg或png。然而,ImageMagick生成的图像质量非常低,Ocropus几乎
无法
识别
任何内容。我想了解处理低质量
pdf
的最佳参数是什么,以便为
OCR
提供尽可能好的质量图像。
浏览 0
提问于2010-09-01
得票数 9
回答已采纳
8
回答
OCR
文字
识别
技术有哪些应用?
OCR
是实时高效的定位与
识别
图片中的所有
文字
信息,返回
文字
框位置与
文字
内容。支持多场景、任意版面下整图
文字
的
识别
,以及中英文、字母、数字的
识别
。简单来说就是将图片上的
文字
内容,智能
识别
成为可编辑的文本,这么强大的功能在我们生活当中有哪些应用呢?
浏览 3696
提问于2018-08-24
1
回答
人脸核身的费用中包含
OCR
身份证
识别
吗?
、
浏览 162
提问于2022-06-15
3
回答
将
pdf
的内容读取为字符串
、
、
如何将
PDF
的内容以字符串的形式快速读取。我想稍后过滤这个字符串并从中获取特定的文本元素。
PDF
来自一个url,我将它加载到一个web视图中并使用NSURL扩展来缓存它。var urlAsString = String(contentsOfURL: NSURL(string: "http://web.shschools.org/shpid/pdfs/WXS5N48Z.
pdf
, encoding: NSUTF8StringEncoding, error: nil) 但是,我认为这是无
浏览 14
提问于2015-08-02
得票数 0
回答已采纳
1
回答
文字
识别
能否实现全书某个关键词搜索?
浏览 152
提问于2022-06-15
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券