腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
python
dataframe
中
的
链接
中
打开
、
保存
和
提取
文本
PDF
、
、
、
我想遍历
保存
在
python
dataframe
中
的
PDF
链接
。目标是
打开
PDF
链接
,
保存
PDF
并从中
提取
文本
,然后将每个相应
链接
的
文本
保存
到新列
中
。
Dataframe
看起来像这样: URL 0 https://
浏览 24
提问于2021-09-30
得票数 0
回答已采纳
1
回答
使用
python
显示docx文件
的
内容
、
假设我有两个文件abc.docx
和
xyz.docx,其中abc有一些表格
和
一些段落。我想在docx
中
显示数据。但是我下面的代码是
提取
文本
和
打印it.Can,有人建议我怎么做呢?下面是我
的
代码:file2 = 'xyz.docx' message1在这里,我
的
表
中</em
浏览 2
提问于2019-09-23
得票数 1
1
回答
将cp1251
pdf
解析为
python
中
的
文本
、
、
、
有什么方法可以用俄文(cp1251)
从
pdf
文件中
提取
文本
吗? 对于解析
pdf
文件,我使用pdfminer包。我试图在pdfminer.converter.TextConverter类
的
参数中指定编码,但没有帮助。
浏览 7
提问于2015-08-26
得票数 1
回答已采纳
3
回答
将
PDF
转换为.ipynb (
从
PDF
中
恢复木星笔记本)
、
、
我有一个
PDF
文件是
从
木星笔记本创建
的
,但是原始
的
.ipynb文件丢失了。有什么工具可以帮助将
PDF
转换成.ipynb吗?
浏览 2
提问于2020-06-24
得票数 0
2
回答
用
Python
将
PDF
文件转换为
文本
文件
、
、
、
、
我已经花了好几天
的
时间在网上研究如何
从
pdf
文件
中
获取特定
的
信息。最终,我能够使用
Python
从
文本
文件
中
获取所有信息(我通过转到
PDF
文件-> file ->文件 问题是如何让
Python
完成这些任务(
打开
PDF
文件(
打开
它-非常容易
打开
(“文件路径”),点击菜单
中
的
File,然
浏览 3
提问于2016-07-21
得票数 3
回答已采纳
1
回答
如何将编码
文本
转换为正文(不使用编码创建
的
特殊字符)
、
、
、
我将从一系列
PDF
文件中
提取
文本
来进行主题建模。
从
PdF
文件中
提取
文本
后,我将把每个
PDF
文件
的
文本
保存
到一个.txt文件或.doc文件
中
。为此,我遇到了一个错误,即我应该添加.encode('utf-8')来将
提取
的
文本
保存
到.txt文件
中
。所以,我添加了txt = st
浏览 21
提问于2021-06-30
得票数 1
回答已采纳
2
回答
如何使用
python
从
pdf
中
的
不平衡表中
提取
数据?
、
、
我需要使用
Python
从
PDF
表格中
提取
数据(如下所示)。首先,我希望在页面上显示所有左侧数据,然后再显示右侧数据。我尝试过使用text.split('\n')
和
re.split(r'\s{3,}'),但都不起作用。 import pdfplumber with pdfplumber.open(
pdf
)
浏览 13
提问于2021-06-17
得票数 0
1
回答
是否有可能创建这样一个工具,允许将正在读取
的
文本
从
PDF
读取器
保存
到字符串
中
,以便以后处理此
文本
?
、
、
、
、
Linux有一个
PDF
读取工具,称为"Xreader“,默认情况下与操作系统安装一起安装。是否有可能创建这样一个工具,允许在选择此
文本
时使用鼠标左键单击将被读取
的
文本
保存
为Bash或
Python
字符串,以便以后使用Bash
和
/或
Python
工具处理
保存
的
文本
?Linux
中
是否有这样一种“机制”,可以用来实现这一目的? 澄清。我尝试创建一个
Python</
浏览 0
提问于2023-03-21
得票数 0
1
回答
如何
提取
PDF
年度报告
的
叙述部分以进行
文本
分析?
我想使用FOG指数作为我学士学位论文
的
一部分来比较SFCR报告
和
IFRS报告中保险公司
的
报告。报告以
PDF
格式提供。提前感谢!
浏览 0
提问于2020-11-11
得票数 1
1
回答
如何避免PyPDF
中
裁剪部分
的
文本
?
、
我对
python
非常陌生,我正在做一个ML项目,
从
PDF
(已发布
的
年度报告)中
提取
披露信息。PyPDF
提取
了我
的
项目所需
的
信息,但它也包含了我想要删除
的
文本
中
的
页脚
文本
。我浏览了堆栈溢出,并找到了一个解决方案,成功地通过PyPDF裁剪出页脚部分,并将文件
保存
为一个新
的
pdf
。但是,当我在原始代码
中</e
浏览 5
提问于2022-10-14
得票数 1
回答已采纳
4
回答
PDF
-将单个单词拆分为单独
的
行-
Python
3
、
、
、
我正在尝试将
PDF
中
的
单词
提取
到单独
的
行
中
,但只能对
文本
文件执行此操作,如下所示。 此外,规则是我不能将
PDF
文件转换为TXT,然后执行此操作。必须对
PDF
文件执行此操作。我也需要对可搜索
的
PDF
文件做同样
的
事情。任何帮助都将不胜感激。
浏览 66
提问于2019-12-06
得票数 0
回答已采纳
1
回答
Azure机器学习无法将
PDF
作为web服务
的
输入
、
我在azure ML上部署了一个随机
的
森林实验,我试图根据文档包含
的
单词对文档进行评分。这些文档是
PDF
格式
的
。当我将这个实验部署为web服务时,它不允许我输入
PDF
。有没有一种方法可以将
PDF
输入到web服务?
浏览 0
提问于2017-02-06
得票数 1
1
回答
如何像Chrome浏览器那样使用
Python
从
PDF
中
提取
文本
?
、
、
我正在尝试
从
pdf
文件中
提取
文本
(类似于表单)。目前,我在Chrome上
打开
文件,选择/复制所有
文本
,将其粘贴到txt文件
中
,然后使用
Python
将其处理为CSV。Chrome让我
的
数据非常结构化
和
统一,这样
pdf
的
每一页都会产生类似的
文本
块,让我可以轻松地处理它。我试图直接
从
pdf
中
提取
文本
浏览 35
提问于2021-06-16
得票数 0
2
回答
从
PDF
中
提取
文本
,并将
提取
的
文本
保存
在Excel或其他地方
、
我不是专业
的
程序员。我想要一个简单
的
方法,
从
pdf
中
提取
文本
,并将
文本
保存
到Excel
中
。 我可以使用
Python
,R或其他用户友好
的
软件
浏览 16
提问于2020-07-13
得票数 0
1
回答
内联图像
的
iText GetTextFromPage异常
、
、
、
我有与讨论过
的
相同
的
问题,但没有得到解决。我
的
目标是
从
现有的
pdf
文件中
提取
文本
。我得到了某个
pdf
的
错误消息Could not find image data or EI,我不能将其作为示例分享。它适用于其他
pdf
,使用以下代码PdfReader reader = new PdfReader(f
浏览 1
提问于2014-02-26
得票数 0
8
回答
PDF
中
的
Copy+pasting
文本
导致垃圾
、
它从
PDF
文件中
提取
纯
文本
。有几个
PDF
文件无法正确
提取
。
提取
器(PDFBox库)返回如下字符串: 我是检查每个文件,使这个
提取
的
问题,所有这些文件
的
文本
也不能复制粘贴
从
浏览 5
提问于2010-05-28
得票数 15
1
回答
在Flask应用程序
中
从
PDF
文件中
提取
文本
、
、
我需要从用户上传
的
.
pdf
文件中
提取
文本
。
从
pdf
文件
中
获取
文本
的
解决方案有很多,但据我所知,在这些解决方案
中
,您需要将file作为参数提供给
打开
文件,然后
提取
文本
。要获取路径,我必须将其
保存
在目录
中
,然后读取它,但可能有多个文件已经上载,文件选择将是一个问题。使用BytesIO,你可以创建一个内存
中
的
浏览 33
提问于2021-10-01
得票数 0
回答已采纳
1
回答
从
pdf
文件
中
读取图像
、
、
、
、
我有一个要求,客户将上传一个
pdf
文件,其中包含图像/s。我必须读取那个
pdf
文件,
从
它们中
提取
图像,然后将图像
保存
到db
和
硬盘
中
。但我不知道如何使用
Python
/Django代码
从
pdf
文件中
提取
图像。是否有
从
pdf
文件
中
读取
和
提取
图像
的
python
库。
浏览 2
提问于2013-08-09
得票数 0
回答已采纳
1
回答
python
从
列
中
打开
PDF
urls并将
文本
数据加载到新列
中
、
、
、
URL栏包含web上
PDF
的
链接
。我想
打开
每个
pdf
并将
pdf
的
内容复制到新
的
列
PDF
data
中
。我知道一些
PDF
文件可能会很长,在某些情况下,该列
中
的
文本
数量可能会很大。例如,在第一行
中
,我希望将URL '‘
的
内容复制到列
PDF
data
中
。 对于第二行,<em
浏览 12
提问于2018-02-13
得票数 0
3
回答
在
PDF
中
添加
链接
、
、
、
、
我有几个
PDF
是用Microsoft生成
的
。我想: 我更喜欢
Python
,但我愿意接受其他
的
选择。 编辑:,我无法访问原始Word文档。我需要操纵
PDF
本身。我正在
浏览 9
提问于2015-03-01
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
黑科技教程,Python批量提取并保存docx文档中的图片!
从零开始:手把手教你使用Python实现PDF到Excel的转换
python玩转PDF文档
在Python中使用PDF:阅读和拆分
干货:手把手教你用Python读写CSV、JSON、Excel及解析HTML
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券