腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
可将OCR文本插入回源
PDF
的OCR库
、
是否有库(或可执行文件)
可以
OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
2
回答
Acrobat XI Pro喜欢
pdf
阅读器
、
、
我如何安装一个
PDF
阅读器,像“杂技XI专业”,让我突出文本,有
文字
识别
,让我组合和转换
PDF
格式和其他格式?
浏览 0
提问于2015-02-02
得票数 0
2
回答
柬埔寨字母表上的交货单
、
、
我得到了一个问题与Prestashop 1.7.4.2交货单,它不能
识别
高棉
文字
母。有谁
可以
帮助我用哪种字体来显示这些字母? 我已经在\override\classes\
pdf
\PDFGenerator.php中添加了支持的字体,但它不起作用。
浏览 1
提问于2020-06-10
得票数 2
1
回答
查找没有文本的
PDF
、
、
我有很多文件夹与很多
PDF
,我想要光学字符
识别
那些没有
文字
层。所以首先,我想找到他们。我以为也许用pdfgrep的烟斗就能做好这份工作,但我迷路了。 如何找到没有文本的
PDF
?
浏览 0
提问于2021-01-15
得票数 5
回答已采纳
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中的文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中的文本。 所有都是一样的,
浏览 1
提问于2019-03-07
得票数 0
2
回答
除
PDF
以外的所有文件链接的JS RegEx
、
我正在尝试匹配HTML文档中包含特定文件夹链接的所有href属性,而不是
PDF
。我很难让它匹配,我有一个
可以
得到所有
PDF
的:但我排除
PDF
的尝试并没有让我走得太远。有没有办法做我想要的,或者我只是匹配所有的文件而不是使用条件语句来检查它是否是
PDF
?谢谢!
浏览 1
提问于2013-06-04
得票数 0
1
回答
使用Java和Itext编辑
PDF
文本
、
有办法编辑
PDF
文档文本吗?比如找到和替换特定的文本?我能够编辑特定坐标(x,y)的
pdf
,但无法
识别
和替换。我看到的所有库都是从零开始创建的
PDF
和小的编辑功能。不管怎样,我
可以
用itext编辑上面的解释吗?请advise...thank你! **例子:一份
pdf
文件载有以下的副翼。是最古老的古希腊和拉丁文,在单词或其他
文字
之间几乎没有空格,
可
浏览 5
提问于2014-07-10
得票数 2
1
回答
文字
识别
可以
识别
电子账单吗?
浏览 212
提问于2022-06-15
1
回答
哪种中
文字
体是中国人民的
PDF
阅读器普遍支持的?
、
我正在生成
PDF
文件,其中包含英文和中
文字
符(使用Ruby对虾库)。我不想在生成的
PDF
文件中嵌入中
文字
体文件,因为这些文件需要保持较小。所以,我想知道我是否
可以
在
PDF
文件中提到一个中
文字
体名,让
PDF
阅读器正确地呈现汉字,因为
PDF
阅读器已经有了中
文字
体文件。 这有道理吗?如果是这样的话,在大多数中国人使用的
PDF
阅读器中是否会安装一些常用的中
文字
体?
浏览 2
提问于2015-05-06
得票数 2
回答已采纳
1
回答
OCR
可以
识别
PDF
文件吗?
浏览 221
提问于2022-06-15
1
回答
关于拆分
PDF
和OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我知道Python的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别
字符并将输出转换为csv或文本文件。 提前感谢您……
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
帮助Canon CanoScan LiDE扫描
PDF
文档
、
、
、
当我使用Windows 7中的扫描仪,并将扫描过的书籍页保存为
PDF
格式时,我
可以
打开
PDF
扫描页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我通过简单的扫描将页面扫描为文本,并将其保存为
PDF
格式。但是在Ubuntu中,当我打开扫描的
PDF
页面时,它会打开OK,但是我不能复制文本。
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
2
回答
使用java从
pdf
中
识别
和提取表格
、
、
、
我有不同类型的
pdf
,其中包含多个东西,如
文字
,表格等。该表可能存在任何地方的
pdf
(顶部,中部,底部)。我只想提取表数据(否)。列上的,不。在不传递位置的情况下使用java从
pdf
中提取行和表中的数据。 有人能告诉我如何用iText &
浏览 12
提问于2017-03-31
得票数 1
1
回答
文字
识别
可以
识别
空格并保留吗?
浏览 221
提问于2022-06-15
2
回答
docx转换为朝鲜语字体的
pdf
、
、
、
这是关于docx到
pdf
的转换,在docx文档中有韩语签名。我
可以
用docx4j把一个文档转换成
pdf
。S
浏览 4
提问于2013-10-21
得票数 0
1
回答
读取内容流时出错
、
、
我正致力于捕获对show的postscript调用,并将当前字体和字体大小存储到
pdf
文本对象中输出。但是identify给了我一个错误: **** Error reading a content stream.pd0.
pdf
[0] PBM 612x792 612x792+0+0 16-bit Bilevel Gray 61KB 0.000u 0:00.000 pd0.
pdf
[1] PBM 612x792 612x792+0+0 16-bit Bilevel Gray 61KB
浏览 1
提问于2018-02-12
得票数 0
回答已采纳
1
回答
从
PDF
文件中提取文档信息,比如页边距宽度?
我使用了qpdf和pdfinfo等工具从poppler获得有关
PDF
文档的信息。然而,我正在寻找一种方法,以获得更具体的信息,如宽度的边距,字体家族使用的,等等。然而,qpdf有一个--json选项,它将
PDF
转换成它的JSON表示形式。我对JSON非常熟悉,但是找不到任何叫做“边距”或“字体-家庭”的属性。这样的信息是否以
PDF
格式记录?我的主要目标是能够复制文档中的所有页边距/字体信息(假设它们是一致的,并且是从TeX或LaTeX之类的程序中生成的),这样我就
可以
复制它们的精确样式。现在,我必须使用
P
浏览 0
提问于2021-09-14
得票数 1
1
回答
在Java中使用iText替换占位符
、
、
我有一个包含像<%DATE_OF_BIRTH%>这样的占位符的
PDF
,我希望能够在
PDF
中阅读并使用iText将
PDF
占位符值更改为文本。因此,在
PDF
中阅读,使用replaceString()方法并更改占位符,然后生成新的
PDF
。谢谢。
浏览 3
提问于2014-04-15
得票数 2
8
回答
OCR
文字
识别
技术有哪些应用?
OCR 是实时高效的定位与
识别
图片中的所有
文字
信息,返回
文字
框位置与
文字
内容。支持多场景、任意版面下整图
文字
的
识别
,以及中英文、字母、数字的
识别
。简单来说就是将图片上的
文字
内容,智能
识别
成为可编辑的文本,这么强大的功能在我们生活当中有哪些应用呢?
浏览 3726
提问于2018-08-24
1
回答
直接编辑
PDF
然后删除编辑仍然会导致
pdf
损坏。
我的
PDF
看起来很好,直到我编辑了它,现在它似乎仍然被破坏,即使我删除了我的编辑。文件diff程序表示这两个文件是相同的,但只有一个文件显示信息。复制:2)在文本编辑器中打开
PDF
并在顶部添加文本4)删除步骤2中添加的文本是否有任何方法
可以
将文本添加到
PDF</
浏览 5
提问于2017-07-27
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券