腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
PDF
转
Python
中
的
文本
在
图像文件
中
返
回空
结果
python
、
pdf
、
pypdf2
、
pdfminer
、
pdf-extraction
我有这个
pdf
文件..。基于图像
的
低分辨率
pdf
文件。我正在尝试提取其中
的
数据,但我尝试过
的
所有选项似乎都不起作用。= open(path, 'rb') number_of_pages = read_
pdf
.getNumPages() page_c
浏览 42
提问于2021-02-20
得票数 0
回答已采纳
1
回答
用PyPDF2获取复选框和无线电字段
python
、
python-3.x
、
pypdf2
、
pdfminer
我
的
项目涉及从使用开源库
的
一堆
PDF
表单文件
中
读取
文本
。
在
获取以下
文本
数据方面没有问题:cnt = len(reader.pages) print("reading
pdf
(%d pages我还尝试了reader.get_fields()和reader.get_form_text_fields()方法,如中所描述
浏览 6
提问于2022-08-23
得票数 0
1
回答
使用
Python
突出显示
PDF
中
的
文本
python
、
pdf
、
search
、
pypdf
、
pdfminer
我正在为我
的
PDF
数据语料库定制搜索引擎。有没有办法
在
PDF
文件
中
突出显示里面的
文本
?PDFMiner或PyPDF
浏览 0
提问于2016-10-27
得票数 16
1
回答
将cp1251
pdf
解析为
python
中
的
文本
python
、
parsing
、
pdf
、
cp1251
有什么方法可以用俄文(cp1251)从
pdf
文件中提取
文本
吗? 对于解析
pdf
文件,我使用pdfminer包。我试图
在
pdfminer.converter.TextConverter类
的
参数中指定编码,但没有帮助。
浏览 7
提问于2015-08-26
得票数 1
回答已采纳
1
回答
旋转
pdf
页,平行于手绘线(小于90度)
pdf
我有一本扫描过
的
书作为
pdf
文件。 显然,有些页面不正确地对齐,需要一些旋转,小于90度。页面
中
的
文本
没有很好
的
定义限制,但是有一些装饰线是垂直
的
或水平
的
,可以用作标记。是否有任何解决方案来一个接一个地修复页面,画一条线或类似的东西,用光学
的
方式定义方向?
浏览 0
提问于2022-02-15
得票数 0
2
回答
如何在
pdf
文件
中
复制图像
中
的
文本
?
pdf
、
images
、
text
我可以使用evince文档查看器使用
文本
查看
pdf
图像,但是我不能选择图像
中
的
文本
来复制和粘贴。如何在
pdf
文件
中
从图像
中
复制
文本
?
浏览 0
提问于2014-09-19
得票数 0
2
回答
Python
-将JPG转换为
文本
文件
python
、
config
大家早上好, 我制作了一个
Python
脚本,它根据预设
的
模板
在
图像
的
顶部添加
文本
。我现在正在开发一个模板编辑器,它允许用户
在
GUI
中
编辑模板,然后将模板保存为一个配置文件。其思想是,一个用户可以创建一个模板,导出它,并将它发送到另一台计算机上
的
新用户,后者可以将它导入到他们
的
配置文件
中
。第二个用户将保留模板上
的
全部编辑能力(如果需要进行任何更改)。现在,除了
文本
之外,我还希望能够将
浏览 11
提问于2022-11-16
得票数 0
7
回答
grep能在
pdf
文件上正常工作吗?
pdf
、
full-text-search
、
grep
可以使用'grep‘命令搜索多个
pdf
文件吗?它似乎不起作用,人们如何在多个
pdf
文件上搜索内容?
浏览 0
提问于2010-04-22
得票数 3
回答已采纳
1
回答
需要使用Tesseract API实现批量
PDF
提取
hadoop
、
pdf
、
tesseract
、
pdfbox
我有大量
的
PDF
文档,我需要从中提取
文本
。用于进一步处理
的
提取
文本
。我以线性
的
方式使用Tesseract API对一小部分文档进行了这一操作,并获得了所需
的
输出。然而,我面临着将Tesseract API实现到Hadoop (Map)方法
中
的
问题。当Teserract将这些文件转换为中间
图像文件
时,我对
在
HDFS
中
如何处理Tesseract-API-进程
的
中间<e
浏览 4
提问于2017-06-17
得票数 0
回答已采纳
1
回答
使用
python
将png/jpg转换为word文件
python
、
png
、
jpeg
、
converters
我需要将很多jpg/png文件转换为docx文件&然后转换为
pdf
。我唯一关心
的
是将图像
中
的
数据写入
pdf
文件&如果我需要手动编辑任何
文本
,我可以
在
word
中
这样做,并将其保存在相应
的
pdf
文件
中
。我试过使用API,但失败了,因为
文本
不正确匹配。我已经有
浏览 7
提问于2022-10-20
得票数 -1
回答已采纳
2
回答
如何使Google
在
我上传
的
PDF
上执行OCR?
google-drive
、
ocr
我有一个
PDF
,这是一本书
的
几页扫描。我希望能够在这个
PDF
中
搜索特定
的
条款。我知道OCR可以
在
Google
的
文件上执行。然而,我似乎无法手动启动,我上传
的
PDF
似乎没有可选择
的
文本
(我甚至无法从Google
的
搜索栏
中
搜索其中
的
短语)。有办法“强迫OCR”吗?
浏览 0
提问于2017-11-11
得票数 2
2
回答
tesseract ocr不工作于只有2或更短
文本
长度
的
图像。适用于
文本
长度大于3
的
图像
python-3.x
、
ocr
、
tesseract
、
cv2
ImagePath" #you can use image I have uploaded 我正在从
PDF
为此,我正在将
pdf
转换为png。检测直线,逐行相交确定表,然后裁剪单个单元格以获取其
文本
。 由tesseract产生:
的
结果
浏览 0
提问于2018-08-09
得票数 1
回答已采纳
1
回答
PDFsharp示例"ExportImages“删除水印
c#
、
pdfsharp
你好,我正在使用PDFsharp示例将
PDF
转换为图像格式。但是我
的
PDF
有一个日期戳(水印),这在
图像文件
中
丢失了。有没有办法也能在图像上盖上图章?
浏览 3
提问于2015-09-27
得票数 0
1
回答
Google驱动器索引大型文件
的
限制是什么?
java
、
google-drive-api
我使用谷歌驱动api来存储和检索
pdf
文件。我想使用搜索参数查询这些文件。我尝试了一些搜索驱动器网站,但它并不总是有效
的
。 我想知道这些是否有任何限制,以及它们是什么。
浏览 2
提问于2012-08-28
得票数 8
3
回答
用于读取
PDF
文件
的
Python
python
、
pdf
我发现很多帖子都提出了阅读
PDF
的
解决方案。我想一个字一个字地阅读
PDF
文件,并对它做一些处理。人们推荐pdfMiner,它可以将整个
PDF
文件转换成
文本
文件。但我想要
的
是一个字一个字地读
PDF
。有没有人能推荐一个这样
的
图书馆呢?
浏览 2
提问于2011-05-10
得票数 11
回答已采纳
1
回答
如何从macOS蒙特雷
的
图片导出可搜索
的
PDF
(实时
文本
)
macos
、
livetext
在
macOS 12 (蒙特雷)
中
,有一个名为
的
新特性。它可以通过OCR识别图像
中
的
文本
。有任何
浏览 9
提问于2022-03-02
得票数 2
3
回答
如何使用XSL-FO将外部
pdf
/txt文件嵌入到另一个文件
中
?
xslt
、
pdf
、
pdf-generation
、
xsl-fo
是否可以使用XSL-FO/XSLT将外部
PDF
或
文本
文档嵌入到主
PDF
中
? 我使用xslt样式表来生成
PDF
文档。但是,输入
的
XML包含内联
文本
或Base64编码
的
PDF
文档。因此,
在
样式表
的
HTML版本
中
,我提取
文本
或
PDF
并将其
转
储到磁盘上。然后
在
xslt
中
,我有这样
的<
浏览 0
提问于2011-05-21
得票数 5
回答已采纳
1
回答
使用pypdf2从
pdf
文件中提取
文本
python
、
pdf
、
extraction
、
pypdf2
、
skia
尝试使用
python
(v3.8.2)模块pypdf2(v1.26.0)从
pdf
文件/s中提取
文本
。所有的好,除了与特定
的
pdf
文件/s(产生
的
铬打印选项)。
在
使用chrome
的
print选项生成/下载
的
期间,我有这些文件,其中有一个选项可以将页面/文档保存为
pdf
。我无法从这些
pdf
文件中提取
文本
,因为代码只返回‘’(空),其他
pdf
浏览 4
提问于2020-05-13
得票数 0
回答已采纳
1
回答
Android中
文本
文件
的
预览图像
android
、
text-files
、
thumbnails
我想知道是否可以
在
Android
中
获得任何
文本
文件
的
预览图像(缩略图),比如
PDF
、DOC、TXT、PPT、PPTX、RSS或HTML。如果反应是肯定
的
,我怎样才能做到呢?我有预览图像
的
视频和
图像文件
,我想要获得相同
的
结果
文本
文件。 谢谢你
的
关注,问候。
浏览 2
提问于2014-10-22
得票数 0
21
回答
从图像列表创建
PDF
python
、
pdf
有什么实用
的
方法可以使用
Python
从
图像文件
列表
中
创建
PDF
吗?use
PDF
::FromImage;my $
pdf
=
PDF
::FromImage->new;$
pdf
->write_file($boo
浏览 5
提问于2014-12-06
得票数 116
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
jpeg转换成pdf,教你这三种简单又实用的方法
图片转换成pdf用什么软件?试试这些内容吧
60行Python代码将 PDF 文档转换为 Word 文档
分享5个开源文本文档处理工具
图片怎么转换成pdf格式?这几种转换工具新手必备!
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券