腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Acrobat XI Pro喜欢
pdf
阅读器
、
、
我如何安装一个
PDF
阅读器,像“杂技XI专业”,让我突出文本,有
文字
识别
,让我组合和转换
PDF
格式和其他格式?
浏览 0
提问于2015-02-02
得票数 0
1
回答
使用Java和Itext编辑
PDF
文本
、
有办法编辑
PDF
文档文本吗?比如找到和替换特定
的
文本?我能够编辑特定坐标(x,y)
的
pdf
,但
无法
识别
和替换。我看到
的
所有库都是从零开始创建
的
PDF
和小
的
编辑功能。不管怎样,我可以用itext编辑上面的解释吗?请advise...thank你! **例子:一份
pdf
浏览 5
提问于2014-07-10
得票数 2
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中
的
文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中
的
文本。 我试着测试更多
的<
浏览 1
提问于2019-03-07
得票数 0
1
回答
查找没有文本
的
PDF
、
、
我有很多文件夹与很多
PDF
,我想要光学字符
识别
那些没有
文字
层。所以首先,我想找到他们。我以为也许用pdfgrep
的
烟斗就能做好这份工作,但我迷路了。 如何找到没有文本
的
PDF
?
浏览 0
提问于2021-01-15
得票数 5
回答已采纳
2
回答
可将OCR文本插入回源
PDF
的
OCR库
、
是否有库(或可执行文件)可以OCR
PDF
(通常是通过扫描纸张创建
的
PDF
),并将
识别
出
的
文本重新注入到
PDF
中?很可能是扫描图像背后
的
隐形
文字
。 最好是开源
的
。(目标:我有一个巨大
的
由Lucene索引
的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关
的
。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
直接编辑
PDF
然后删除编辑仍然会导致
pdf
损坏。
我
的
PDF
看起来很好,直到我编辑了它,现在它似乎仍然被破坏,即使我删除了我
的
编辑。文件diff程序表示这两个文件是相同
的
,但只有一个文件显示信息。复制:2)在文本编辑器中打开
PDF
并在顶部添加文本4)删除步骤2中添加
的
文本 5)尽管有相同
的
文件内容,但
PDF
仍然损坏。如果我真的将代码从
PDF
复制并粘贴到不同
浏览 5
提问于2017-07-27
得票数 0
回答已采纳
2
回答
除
PDF
以外
的
所有文件链接
的
JS RegEx
、
我正在尝试匹配HTML文档中包含特定文件夹链接
的
所有href属性,而不是
PDF
。我很难让它匹配,我有一个可以得到所有
PDF
的
:但我排除
PDF
的
尝试并没有让我走得太远。有没有办法做我想要
的
,或者我只是匹配所有的文件而不是使用
浏览 1
提问于2013-06-04
得票数 0
2
回答
柬埔寨字母表上
的
交货单
、
、
我得到了一个问题与Prestashop 1.7.4.2交货单,它不能
识别
高棉
文字
母。有谁可以帮助我用哪种字体来显示这些字母? 我已经在\override\classes\
pdf
\PDFGenerator.php中添加了支持
的
字体,但它不起作用。
浏览 1
提问于2020-06-10
得票数 2
1
回答
如何在
PDF
中压缩图像?
、
、
、
、
如何在Linux下使用批处理工具提高
PDF
上
的
JPEG压缩级别? 显然,您可以使用gs -dPDFSETTINGS=/screen或/ebook,但这降低了
PDF
的
采样量--它减少了DPI。在保持相同像素计数
的
同时使用JPEG压缩,效率更高(从
PDF
看起来每KB多好
的
角度来看)。例如:https://docupub.com/pdfcompress/允许你
的
一半大小
的
P
浏览 0
提问于2021-01-08
得票数 2
2
回答
使用java从
pdf
中
识别
和提取表格
、
、
、
我有不同类型
的
pdf
,其中包含多个东西,如
文字
,表格等。该表可能存在任何地方
的
pdf
(顶部,中部,底部)。我只想提取表数据(否)。列上
的
,不。在不传递位置
的
情况下使用java从
pdf
中提取行和表中
的
数据。 我也使用过PDFBox java,但它也解决不
浏览 12
提问于2017-03-31
得票数 1
1
回答
用
PDF
>JPG进行
pdf
2jpg转换
、
我正在尝试将一些
PDF
转换为JPG,并使用
pdf
2jpg进行此操作。我运行
的
代码是:print(inputPath) 奇怪
的
是,当我运行最后两行注释掉
的
相同代码时,我得到: C:/Users/Username/Desktop&
浏览 1
提问于2018-08-22
得票数 3
回答已采纳
1
回答
巨蟒中
的
Camelot不像预期
的
那样运行。
我有两个
pdf
文件,都在同一个布局与不同
的
信息。问题是:我可以很好地阅读其中一个,但另一个是
无法
识别
的数据。这是一个我可以很好地阅读
的
例子,下载 from_
pdf
= camelot.read_
pdf
('2019_05_2.
pdf
', flavor='stream', strict=False) camelot.plot
浏览 4
提问于2021-09-09
得票数 0
回答已采纳
1
回答
OCR可以
识别
PDF
文件吗?
浏览 212
提问于2022-06-15
1
回答
os.walk是否适用于非转义反斜杠?
、
只是在我正在写
的
一小段代码中发现了一个bug,而实际上并没有bug?for filename in filenames:两者都可以在shell中运行,并且完整
的
代码运行良好
浏览 19
提问于2016-09-12
得票数 0
回答已采纳
1
回答
关于拆分
PDF
和OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过
的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。哪种编程语言和库给了我最大
的
灵活性来完成这样
的
任务,而不需要我做所有繁琐
的
工作。我对Python很熟悉。我知道Python
的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别
字符并将输
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
Android:如何测试显示在WebView中
的
pdf
、
、
在安卓系统中,我想测试包含条款和条件
的
PDF
文件,但是这个文件显示在WebView中。我可以切换到WebView,我使用下面的代码。
浏览 4
提问于2022-11-09
得票数 -1
2
回答
Python2.7:在Windows 7中使用pypdfocr有困难
、
、
这是我尝试使用pypdfocr in cmd时得到
的
错误消息。C:\Users\chamar.stu>pypdfocr F:\test2.
pdf
开始转换F:\test2.
pdf
'pdfimages‘不被
识别
为内部或外部命令、可操作
的
程序或批处理文件。警告:
无法
执行pdfimages来计算DPI (尝试安装xpdf或po ppler?)ValueError: int()
的
无效
文字
,基数为10:'00alpha‘ 我似乎错
浏览 2
提问于2017-03-17
得票数 2
2
回答
Jasper报告
PDF
不接受中
文字
符
、
、
我
无法
使用jasper报告将中
文字
符嵌入到
pdf
中。我得到
的
是英
文字
符,而不是中文文本。如果有人能为我提供这个问题
的
快速修复,我将不胜感激。
浏览 2
提问于2015-06-01
得票数 3
1
回答
如何在将文档从
PDF
转换为文本时处理unicode字符编码问题
、
、
、
、
我正在尝试从
PDF
中提取文本。
PDF
包含印地语(Unicode)文本。我使用
的
提取实用程序是Apache PDFBox ( )。提取器提取文本,但文本
无法
识别
。我尝试了在多种编码和字体之间切换,但仍然
无法
识别
预期
的
文本。下面是一个例子:假设
PDF
中
的
文本是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
1
回答
FPDF:没有正确输出俄文文本
、
、
在我
的
PHP项目中,我有一个
PDF
,我想输出俄语文本:Я дейÑтвую Ñкорее доверительно Ð 在我
的
pdf
中,不是输出相应
的
Cyrllic,而是输出这些
无法
识别
的字符。下面是我
的
FPDF代码
的
摘录,请注意
浏览 1
提问于2016-01-23
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券