腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(5644)
视频
沙龙
1
回答
如
何在
python
中
提取
docx
的
特定
列
并
保
存到
dataframe
中
?
、
、
、
、
我在一个
docx
中有以下两个表 #Table one item components Description qty ion table
浏览 29
提问于2021-07-09
得票数 0
1
回答
使用
python
计算word
docx
中
的
行及其值
、
、
、
、
我有一个单词
docx
,它不包括桌子。每个表都有不同
的
行和列名,但是在所有不同
的
表(即“测试自动化”)
中
,所有一行名称都是相同
的
,它
的
值为“是或否”。这里我
的
问题是,如何计算使用
python
3.6
的
“测试自动化”行
的
总no值,
如
“测试AUTOMATION:yes=200,no=100
的
总NO”。我是蟒蛇新手,请帮帮我。我
的
示例代码用于表
提取
和<em
浏览 3
提问于2017-10-11
得票数 1
回答已采纳
1
回答
我如何使用Pyspark将doc/
docx
/docm文件保
存到
目录或S3桶
中
?
、
、
、
我试图将数据帧保
存到
文档
中
,但它返回时表示以下错误我
的
代码如下: f_data.write.form
浏览 8
提问于2022-12-02
得票数 0
1
回答
从word中
提取
文本并转换为
Dataframe
、
我需要
提取
单词(.
docx
)
中
的
特定
文本部分。文档
的
结构如下: Question 1: two fiveExplanation: There are four ítems in the有了这些信息,我必须创建一个如下所示
的
Dataframe
: ? 我可以打开文档,
提取
文本
并
打印以开头
的
行,但无法
提取
感兴趣<e
浏览 17
提问于2020-12-16
得票数 0
2
回答
如何连接
python
中
的
docx
文件?
、
、
、
、
下面是我
的
代码: for root, dirs, files in os.walk(paths): if t.endswith
docx
包含:#
docx
包含虚拟文本!#
docx
1 contains:data1data3 data6data8 我想将
docx
文件
的
内容保
存到<
浏览 2
提问于2021-07-10
得票数 0
回答已采纳
1
回答
从
docx
文件中
提取
特定
字体
的
文本
、
、
、
我使用
Python
3.4和
python
-
docx
库来处理.
docx
文件。我已经能够从文档中
提取
文本。但我
的
目标是只
提取
那些具有
特定
字体
的
文本(
并
修改它们)。在过去
的
两天里,我一直在
中
搜索这个,但是没有结果。 这里有没有人对这个库有经验,如果有,他们能给我指出正确
的
方向吗?
浏览 1
提问于2014-09-01
得票数 4
2
回答
是否有一个函数允许我在变量
中
存储csv文件
中
的
特定
列表(或标题)?
、
= 3: exit (1) matches.update(match)我使用下一个函数将头存储在报头变量
中
,但这会扰乱以后由dictreader创建
的
字典,这并不理想,因为我希望尝试将dict匹配与文件匹配。
浏览 3
提问于2022-06-21
得票数 -2
回答已采纳
1
回答
表格解析,将图像、图形等从一个
docx
复制到新
docx
-
Python
、
、
、
、
pydocx 我想知道有没有办法用
python
将图片、表格等从一个
docx
保
存到
一个新
的
docx
中
?我正在使用
python
-
docx
来读取一个
docx
,
并
对文本逐段执行一些操作,然后将其复制到一个新
的
docs
中
,但在此活动
中
,任何表格或图片都会丢失。看起来代码本身并不读取它。我想要
的
图片,图表,
列
等在他们
的
地方
浏览 4
提问于2018-09-13
得票数 1
2
回答
在Pandas html文件输出
中
添加了一些样式/格式
、
、
我创建了一个包含8
列
和75行
的
Pandas,
并
使用
dataframe
.to_html导出到html
中
。一切都很好。我想在html文件
中
添加一些格式/样式。例如要么让
Python
程序插入在Pandas导出或添加格式到html文件
的
其他方法之后,即不需要手动添加等等我使用
的
是iPyth
浏览 7
提问于2015-09-09
得票数 0
回答已采纳
1
回答
搜索大量文件,
并
根据搜索字符串将某些行
提取
到单独
的
单个文件
中
、
我有超过100个独立
的
Microsoft Word文件,其名称结构为"ABC - XXXX.
docx
“。它们
的
范围从"ABC - 1800.
docx
“到ABC - 2020.
docx
” 在这些文件
中
的
每个文件中都有一个很大
的
表(有一个变量,但行数很大)。我希望能够一次(在批处理
中
)搜索所有这些文件,以找到并
提取
(但不是删除)包含
特定
字符串
的
行-例如"D
浏览 11
提问于2020-09-27
得票数 0
2
回答
数据争一大组
docx
文件
的
建议!
、
、
本质上,我有一组(200+)半结构化
的
docx
文件。半结构化
的
意思是我想要
的
信息被组织成表格(它是一种表格,包含不同
的
信息来填写),但不幸
的
是,这些表格
的
格式并不一致。有时,当人们在数据
中
输入数据后,他们会意外地撞到后置空间,将表格粘在一起。或者,有时他们会不小心把桌子拆开,例如。 我第一次尝试使用
python
来
提取
数据,使用document.tables、0等。然后,我可以将它拉到每个文档
的
大型<
浏览 0
提问于2019-06-29
得票数 4
1
回答
在
python
中
从
docx
文件中
提取
数据
、
、
我想从带有扩展
docx
的
word文档中
提取
数据。本文档包含一个表格。我想从表
的
每一
列
和每一行
中
获取数据。我在windows7上使用
python
3。(可能也想在windows server2003上运行这段代码)。谢谢
浏览 3
提问于2012-04-28
得票数 1
回答已采纳
1
回答
迭代一个
dataframe
将返回字符串
中
的
空格,而不是用条带()删除。
、
、
、
我有一个
dataframe
试图:-只从一个
列
获取值(列名是' name ') -在没有索引
的
word文档(而不是表)
中
打印出这些值。我正在运行
Python
3.7
并
使用以下
docx
模块: 下面的代码将返回正确<em
浏览 0
提问于2019-04-18
得票数 0
1
回答
理解
docx
文件
中
的
书签
、
、
、
、
我试图从
Docx
文件中
提取
书签,我编写了一段代码,它在一些
Docx
文件中
提取
书签,但是它在一些
docx
文件
中
找不到任何书签。我正在使用
python
-
docx
。我基本上是找到w:bookmarkStart标记,然后转到它
的
父标记
并
检索段落
中
的
所有运行。但是有些文档既没有w:bookmarkStart,也没有超链接标签,但是
Docx
查看器能够识别书签。以下是段落<em
浏览 0
提问于2019-08-29
得票数 1
1
回答
在
Python
中
从csv中
提取
关键字
、
、
、
、
我有一个逗号分隔
的
csv文件,它有三
列
:我正在尝试
提取
列
URL
中
包含
特定
关键字
的
特定
行,例如单词charger。if any(x in df['URL'][i] for x in keywords): output =
浏览 2
提问于2018-02-13
得票数 0
回答已采纳
2
回答
python
在同一行上左对和右对齐。
、
、
、
这是我对此
的
第一个问题,我要预先感谢大家
的
帮助。我对
python
、
python
和一般编程都很陌生。我正在开发一个GUI程序(使用PyQt)来生成一个
docx
格式
的
合同。我有很多事情在工作,但这是我遇到
的
问题。我需要把文字左对齐,右对齐。总之,我相信这是通过改变一个右缩进和点击标签,然后添加文本。但是,我不知道如
何在
python
中
做到这一点。我在文档
中
尝试了其他一些想法,比如enum WD_PARAG
浏览 6
提问于2015-03-05
得票数 2
回答已采纳
1
回答
使用R在Microsoft Word表格
中
自动检索文件名
、
我在Microsoft Word文档中有一个很大
的
表格。 大多数行(但不是所有行)都附加了单个Microsoft Word文件。 我
的
工作是进入每一行
并
手动键入提供附件
的
文件名。例如,对于具有文件附件
的
每一行,自动
提取
文件名并将其记录在其左侧
的
字段
中
。 这就是表格
的
样子。文件位于最右侧
的
列
中
。它左边
的
列
是我将要键入文件名
的
地方。
浏览 19
提问于2020-12-25
得票数 1
回答已采纳
1
回答
使用
python
从pdfs中
提取
特定
文本
、
、
我尝试过不同
的
python
库来从pdfs中
提取
特定
的
文本,我必须从这个pdf中
提取
标题下
的
文本,我必须将从例1开始
的
文本
提取
为菱形粗体。 下一个pdf包含不同格式
的
的
数据。在这个pdf
中
,我必须从历史
提取
数据到检查,然后从检查到调查与历史和调查作为一个excel文件
中
的
列
和相应
的
数据行。<em
浏览 20
提问于2022-06-30
得票数 0
1
回答
使用`df.loc`时出现意外
的
值类型
、
、
给定一个熊猫
DataFrame
如下所示import pandas as pd # 1.0.5 当我检查两个
列
的
类型时,它们
如
预期
的
那样是float64和int64。print(df.dtypes)# y int64但是,当
提取</e
浏览 0
提问于2020-07-19
得票数 2
1
回答
如何使用Pyspark从mongodb
中
仅
提取
特定
行?
、
、
、
我正在从mongodb集合中
提取
数据,
并
使用Spark
python
代码将其写入bigquery表。但我只想
提取
满足条件
的
文档(
如
sql查询
中
的
where条件)。我发现
的
一种方法是读取
dataframe
中
的
整个数据,
并
对该
dataframe
使用过滤器,如下所示: df2 = df.filter(df['date'] <
浏览 1
提问于2021-02-18
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券