前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >【说站】python如何在word中读取表格内容

【说站】python如何在word中读取表格内容

作者头像
很酷的站长
发布于 2022-11-24 08:15:24
发布于 2022-11-24 08:15:24
2K00
代码可运行
举报
运行总次数:0
代码可运行

python如何在word中读取表格内容

word文件看起来很复杂,不方便结构化。事实上,word文档中大概有几种内容:paragraph(段落)、table(表格)、character(字符)。我现在要分析的word文档基本都是段落和表格。本文主要讲述从word中分析表格,并将表格信息结构化的方法。

1、为了使用python解析word文件,可以使用包docx,首先需要在python中安装它。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install python-docx

2、安装后,就可以读取word文件。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
importdocx
fn= r'D:\长恨歌.docx'doc=docx.Document(fn)#按段落读取全部数据
for paragraph indoc.paragraphs:print(paragraph.text)#按表格读取全部数据
 
for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text)
 
table_num=len(doc.tables)#获取文档的表格个数
 
print(table_num)
 
table_0=doc.tables[0]#选取第一个表
 
table_rows =len(table_0.rows)#获取第一个表的行数
 
print(table_rows)
 
tab=doc.tables[0].rows[0].cells[0]#获取第一张表第一行第一列数据
 
print(tab.text)
 
par= doc.paragraphs[2]#读取第三段数据
 
print(par.text)

以上就是python在word中读取表格内容的方法,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验