腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
DOCX
中
的
内容
提取
为
Python
代码
python
、
excel
、
python-3.x
、
docx
我一直在学习如何使用
Python
创建
DOCX
文件。但是,我有一个文档,我想使用
python
自动执行常规编辑。需要根据在excel电子表格中找到
的
术语进行编辑(删除或添加)。我
的
文档大约有25页,有不同
的
格式、表格、段落、标题和一些图像。有没有办法
将
所有这些
内容
提取
到
python
代码
中
,然后我可以根据excel电子表格添加关于在
docx
文件
中
打印或
浏览 21
提问于2019-07-10
得票数 0
1
回答
不使用指定字体/编码
的
fpdf
中
的
write_html()方法
html
、
python-3.6
、
fpdf
我正在使用
docx
2
python
创建一个包含大量引号
的
PDF格式,并使用html=True
将
这些引号导入到
python
中
,这样它们就有了一些标记。/斜体标记呈现为PDF
为
文本。.我并不是真的想改变字体,但是要确保写在PDF上
的
内容
保留了特殊
的
字符,而不是mojibake。但是理想
的
情况是,在每个引号
的
开头会有一些其他html标记,或者一种改变.write_html()方法
浏览 8
提问于2020-06-12
得票数 1
1
回答
使用
python
显示
docx
文件
的
内容
python
、
python-3.x
我正在读取
docx
文件并显示其数据。import docxpy file2 = 'xyz.
docx
' message1 =
浏览 2
提问于2019-09-23
得票数 1
2
回答
是否有一种方法可以
将
内联形状从
docx
中保存为图像文件?
python
、
image
、
docx
、
shapes
我试图使用
python
解析
docx
文件。该文件包含图像和文本。基本上,我需要一种从文件
中
获取图像( InlineShape对象)
的
方法,并将其保存为单独
的
图像(如"smth.jpg")。有办法吗?
浏览 1
提问于2019-07-11
得票数 0
回答已采纳
1
回答
在中将
docx
文件呈现为django模板
python
、
django
、
google-app-engine
、
ms-word
、
django-templates
我试图用Django模板呈现存储在google驱动器
中
的
word文档文件(
docx
)
的
内容
。word文档文件(
docx
)是包含django变量
的
模板。
将
文件转换为google格式将使
docx
文件释放其字体和样式格式,因此我正在尝试在google应用程序引擎
中
实现以下步骤
将
下载
的
文件传递到<e
浏览 4
提问于2014-10-18
得票数 0
1
回答
如何解析简历数据?
python-3.x
、
spyder
我已经应用了这段
代码
来使用
python
从简历中
提取
数据,但是我
的
代码
没有工作。我
的
目标是解析简历或从简历中
提取
数据,然后应用算法对标签进行预测。我
的
目标是在
python
中
“根据技能和简历
内容
对候选人简历进行排序”。pip install
docx
pip install pyresp
浏览 10
提问于2022-03-18
得票数 0
5
回答
使用
python
从MS word
docx
文件
中
逐页
提取
文本
python
、
python-3.x
、
document
、
extraction
、
text-extraction
我有一个MS文件,我需要从其中
提取
文本分页。我尝试过
python
,但它可以
提取
整个文本,但不能
提取
页面。我还将
docx
转换为pdf,然后尝试文本
提取
。问题是,在转换之后,
docx
的
页面结构发生了变化。例如,在转换时,字体大小被更改,而
docx
的
一页
中
的
文本
内容
在pdf
中
占用了多个页面。 我正在寻找一个稳定
的
解决方案,可以从<em
浏览 9
提问于2019-12-18
得票数 4
回答已采纳
1
回答
解析HTML文件,并将标题<h1>和副标题<h2>以及它们下面包含
的
文本存储在其他文件目录
中
(
Python
)
python
、
pandas
、
beautifulsoup
、
html-parsing
、
python-docx
所以我有一个很长
的
HTML页面。我实际上将我
的
.
docx
文档转换为超文本标记语言,因为我希望所有的标题和副标题都存储在单独
的
文件
中
,因为稍后我想要重现相同
的
文件(但删除一些
内容
),所以我
的
想法是,我
将
解析一次超文本标记语言,并存储它
的
所有标题和子标题一次,根据需要,我
将
只获取需要
的
那些。some text some text 2.3 Test Architectur
浏览 4
提问于2020-05-28
得票数 0
2
回答
解析
docx
文件
的
好库是什么?
python
、
javascript
、
node.js
、
document-converter
有什么好
的
库可以帮助以串行方式解析.
docx
文件吗?我正在寻找一个库,它允许我以以下方式解析
docx
文件:parsed = library.parse(d, output="json") "marginRight":1,
浏览 0
提问于2021-06-12
得票数 1
1
回答
编辑Word文档,添加页眉/页脚并保存它-
Python
python-2.7
、
ms-word
、
docx
我想要向word文档
的
每一页添加页眉和页脚,并想要在文档
的
开头添加一些页面,如何使用
python
实现此目的?我尝试过
python
-
docx
,但它不能像我预期
的
那样工作。有没有其他方法可以满足我
的
要求?
浏览 1
提问于2013-07-22
得票数 0
1
回答
如何
将
XML
内容
从xml.etree.ElementTree写入文件?
xml
、
python-3.x
我在用
python
3.5import zipfilewith zipfile.ZipFile('<path to
docx
file>') as
docx
: tree = xm
浏览 2
提问于2017-09-06
得票数 1
回答已采纳
2
回答
字到文字::编号符号被删除
python
、
python-3.5
我有一个.
docx
文件,其中有编号
的
子弹。一个例子是:2.1 random text我
的
代码
:import
docx
2txtpath = ("my_file.
docx
") 我得到
的
text值如下:Sub Topic
浏览 0
提问于2019-04-15
得票数 0
1
回答
Python
:如何写入.
docx
并合并格式?
python
、
python-docx
我有一些
代码
可以
将
内容
写入.
docx
文件
中
的
表格
中
的
单元格。表格已具有预设格式(例如,16号Arial字体、右对齐等)。但是,当
python
写入表时,格式会恢复
为
word
的
默认格式(大小是新罗马字符
的
12倍,左对齐)。示例
代码
: doc = Document('table.
d
浏览 1
提问于2017-10-10
得票数 0
3
回答
在
python
中
从
DOCX
Word文档中
提取
表格
python
、
xpath
、
ms-word
、
docx
我正在尝试
提取
DOCX
Word文档中表格
的
内容
,天哪,我对xml/xpath是个新手。from
docx
import *tableList = document.xpath('/w:tbl') 这会触发"XPathEvalError:未定义
的
命名空间前缀“错误。我确信这只是开发脚本时
的
第一个期望。不幸<e
浏览 3
提问于2011-08-18
得票数 5
回答已采纳
4
回答
如何使用
python
从
docx
文件中
提取
超链接
中
的
url
python
、
python-docx
我一直试图找出如何使用
python
从
docx
文件
中
获取urls,但什么也找不到,我尝试过
python
-
docx
和
python
-
docx
2txt,但
python
-
docx
似乎只
提取
文本,而
python
-
docx
2txt能够从超链接中
提取
文本,而不是urls本身。
浏览 3
提问于2016-11-08
得票数 3
2
回答
解压缩到同一个目录,从使用Pandoc转换
的
不同.
docx
文件中
提取
媒体
linux
、
bash
、
shell
、
pandoc
目标 我正在使用pandoc
将
一些.
docx
转换为.md。这些.
docx
的
图像在转换后被放置在一个目录(markdown-.
docx
/media/)
中
,并且它
的
URL在结果
的
.md文件中被引用。因此,目标是使生成
的
.md文件具有指向标记存储库/media/
中
存储
的
适当图像
的
链接。要做到这一点,所有标记存储库/媒体/下<em
浏览 2
提问于2020-03-17
得票数 2
2
回答
数据争一大组
docx
文件
的
建议!
python
、
similar-documents
、
data-wrangling
本质上,我有一组(200+)半结构化
的
docx
文件。半结构化
的
意思是我想要
的
信息被组织成表格(它是一种表格,包含不同
的
信息来填写),但不幸
的
是,这些表格
的
格式并不一致。有时,当人们在数据
中
输入数据后,他们会意外地撞到后置空间,
将
表格粘在一起。或者,有时他们会不小心把桌子拆开,例如。 我第一次尝试使用
python
来
提取
数据,使用document.tables、0等。然后,我可以将它拉到每个文档
浏览 0
提问于2019-06-29
得票数 4
1
回答
理解
docx
文件
中
的
书签
python
、
xml
、
openxml
、
docx
、
python-docx
我试图从
Docx
文件中
提取
书签,我编写了一段
代码
,它在一些
Docx
文件中
提取
书签,但是它在一些
docx
文件
中
找不到任何书签。我正在使用
python
-
docx
。我基本上是找到w:bookmarkStart标记,然后转到它
的
父标记并检索段落
中
的
所有运行。但是有些文档既没有w:bookmarkStart,也没有超链接标签,但是
Docx
查看器能够识别书签。以下是段落<em
浏览 0
提问于2019-08-29
得票数 1
10
回答
在
python
3.3
中
导入
docx
时出现错误ImportError:没有名为'exceptions‘
的
模块
python
、
python-3.x
、
python-docx
导入
docx
时出现以下错误: from exceptions import PendingDe
浏览 3
提问于2014-03-31
得票数 120
点击加载更多
相关
资讯
黑科技教程,Python批量提取并保存docx文档中的图片!
使用python代码将excel中的图表导出为图片
在 excel 中提取内容,比如将000118.SH中的数字提取出来
如何提取PDF文件中的图片内容?
Python批量提取Word文件题库中的答案
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券