腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Acrobat XI Pro喜欢
pdf
阅读器
、
、
我如何安装一个
PDF
阅读器,像“杂技XI专业”,让我突出文本,有
文字
识别
,让我组合和转换
PDF
格式和其他格式?
浏览 0
提问于2015-02-02
得票数 0
1
回答
使用Java和Itext编辑
PDF
文本
、
有办法编辑
PDF
文档文本吗?比如找到和替换特定的文本?我能够编辑特定坐标(x,y)的
pdf
,但
无法
识别
和替换。我看到的所有库都是从零开始创建的
PDF
和小的编辑功能。不管怎样,我可以用itext编辑上面的解释吗?请advise...thank你! **例子:一份
pdf
文件载有以下的副翼。是最古老的古希腊和拉丁文,在单词或其他
文字
之间几乎没有空格,可以用bo
浏览 5
提问于2014-07-10
得票数 2
1
回答
查找没有文本的
PDF
、
、
我有很多文件夹与很多
PDF
,我想要光学字符
识别
那些没有
文字
层。所以首先,我想找到他们。我以为也许用pdfgrep的烟斗就能做好这份工作,但我迷路了。 如何找到没有文本的
PDF
?
浏览 0
提问于2021-01-15
得票数 5
回答已采纳
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中的文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中的文本。 所有都是一样的,
浏览 1
提问于2019-03-07
得票数 0
2
回答
可将OCR文本插入回源
PDF
的OCR库
、
是否有库(或可执行文件)可以OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
直接编辑
PDF
然后删除编辑仍然会导致
pdf
损坏。
我的
PDF
看起来很好,直到我编辑了它,现在它似乎仍然被破坏,即使我删除了我的编辑。文件diff程序表示这两个文件是相同的,但只有一个文件显示信息。复制:2)在文本编辑器中打开
PDF
并在顶部添加文本4)删除步骤2中添加的文本是否有任何方法可以将文本添加到
PDF
中,并使其不
浏览 5
提问于2017-07-27
得票数 0
回答已采纳
2
回答
除
PDF
以外的所有文件链接的JS RegEx
、
我正在尝试匹配HTML文档中包含特定文件夹链接的所有href属性,而不是
PDF
。我很难让它匹配,我有一个可以得到所有
PDF
的:但我排除
PDF
的尝试并没有让我走得太远。有没有办法做我想要的,或者我只是匹配所有的文件而不是使用条件语句来检查它是否是
PDF
?谢谢! 达伦
浏览 1
提问于2013-06-04
得票数 0
2
回答
柬埔寨字母表上的交货单
、
、
我得到了一个问题与Prestashop 1.7.4.2交货单,它不能
识别
高棉
文字
母。有谁可以帮助我用哪种字体来显示这些字母? 我已经在\override\classes\
pdf
\PDFGenerator.php中添加了支持的字体,但它不起作用。
浏览 1
提问于2020-06-10
得票数 2
2
回答
使用java从
pdf
中
识别
和提取表格
、
、
、
我有不同类型的
pdf
,其中包含多个东西,如
文字
,表格等。该表可能存在任何地方的
pdf
(顶部,中部,底部)。我只想提取表数据(否)。列上的,不。在不传递位置的情况下使用java从
pdf
中提取行和表中的数据。 有人能告诉我如何用iT
浏览 12
提问于2017-03-31
得票数 1
1
回答
如何在
PDF
中压缩图像?
、
、
、
、
如何在Linux下使用批处理工具提高
PDF
上的JPEG压缩级别? 显然,您可以使用gs -dPDFSETTINGS=/screen或/ebook,但这降低了
PDF
的采样量--它减少了DPI。在保持相同像素计数的同时使用JPEG压缩,效率更高(从
PDF
看起来每KB多好的角度来看)。例如:https://docupub.com/pdfcompress/允许你的一半大小的
PDF
,但当你放大它仍然有良好的质量,尽管与一些工件。什么样的Linux工具允许我们将JPEG压缩应
浏览 0
提问于2021-01-08
得票数 2
1
回答
用
PDF
>JPG进行
pdf
2jpg转换
、
我正在尝试将一些
PDF
转换为JPG,并使用
pdf
2jpg进行此操作。to jpg in same folderprint(result,但在被
pdf
2jpg引用时被还原为反斜杠。ETA:切换到反斜杠而不是正斜杠,并使用原始
文字
。' 打印变量仍然给出正确的输出作为文件路径,只是这个部分
无法
识别</
浏览 1
提问于2018-08-22
得票数 3
回答已采纳
1
回答
巨蟒中的Camelot不像预期的那样运行。
我有两个
pdf
文件,都在同一个布局与不同的信息。问题是:我可以很好地阅读其中一个,但另一个是
无法
识别
的数据。这是一个我可以很好地阅读的例子,下载 from_
pdf
= camelot.read_
pdf
('2019_05_2.
pdf
', flavor='stream', strict=False) camelot.plot(from_
pdf
浏览 4
提问于2021-09-09
得票数 0
回答已采纳
1
回答
OCR可以
识别
PDF
文件吗?
浏览 212
提问于2022-06-15
1
回答
关于拆分
PDF
和OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我知道Python的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别
字符并将输出转换为csv或文本文件。 提前感谢您……
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
os.walk是否适用于非转义反斜杠?
、
只是在我正在写的一小段代码中发现了一个bug,而实际上并没有bug?print('The current folder is ' + folderName) print('SUBFOLDER OF ' + folderName + ': ' + subfolder) print(
浏览 19
提问于2016-09-12
得票数 0
回答已采纳
2
回答
Python2.7:在Windows 7中使用pypdfocr有困难
、
、
C:\Users\chamar.stu>pypdfocr F:\test2.
pdf
开始转换F:\test2.
pdf
'pdfimages‘不被
识别
为内部或外部命令、可操作的程序或批处理文件。警告:
无法
执行pdfimages来计算DPI (尝试安装xpdf或po ppler?)ValueError: int()的无效
文字
,基数为10:'00alpha‘ 我似乎错过了Poppler或XPDF,但我确实按照的建议通过安装了Poppler。
浏览 2
提问于2017-03-17
得票数 2
2
回答
Jasper报告
PDF
不接受中
文字
符
、
、
我
无法
使用jasper报告将中
文字
符嵌入到
pdf
中。我得到的是英
文字
符,而不是中文文本。如果有人能为我提供这个问题的快速修复,我将不胜感激。
浏览 2
提问于2015-06-01
得票数 3
1
回答
如何在将文档从
PDF
转换为文本时处理unicode字符编码问题
、
、
、
、
我正在尝试从
PDF
中提取文本。
PDF
包含印地语(Unicode)文本。我使用的提取实用程序是Apache PDFBox ( )。提取器提取文本,但文本
无法
识别
。我尝试了在多种编码和字体之间切换,但仍然
无法
识别
预期的文本。下面是一个例子:假设
PDF
中的文本是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
1
回答
FPDF:没有正确输出俄文文本
、
、
在本表中,俄罗斯数据用
无法
识别
的字符表示,如下所示:在我的
pdf
中,不是输出相应的Cyrllic,而是输出这些
无法
识别
的字符。->AddPage();$
pdf
->SetAuthor('John Miller'); $
pdf
浏览 1
提问于2016-01-23
得票数 0
1
回答
Android:如何测试显示在WebView中的
pdf
、
、
在安卓系统中,我想测试包含条款和条件的
PDF
文件,但是这个文件显示在WebView中。我可以切换到WebView,我使用下面的代码。
浏览 4
提问于2022-11-09
得票数 -1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券