腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
python
显示
docx
文件
的
内容
python
、
python-3.x
我正在读取
docx
文件
并显示其数据。import docxpy file2 = 'xyz.
d
浏览 2
提问于2019-09-23
得票数 1
1
回答
如何
使用
python
模块
从
word文档中
提取
段落
和
表格
中
的
文本?
python
、
docx
如何
使用
python
模块
从
word文档
中
仅
提取
段落
和
表格
中
的
文本,这些文档具有超链接、
图像
、附加
的
excel
表
等对象?我尝试过
docx
2
python
,但它只适用于简单
的
"
docx
“
文件
,而不适用于其中附加了链接或excel
文件
的
文件
。
浏览 3
提问于2020-06-10
得票数 0
4
回答
使用
Python
从
word文档中
提取
图像
和文本
python
、
image
、
ms-word
、
extract
、
pywin32
我想在一个满是word文档
的
文件
夹上运行一个脚本,它可以通读文档,并拉出
图像
及其标题(
图像
下面的文本)。
从
我所做
的
研究来看,我认为pywin32可能是一个可行
的
解决方案。我知道如何
使用
pywin32查找字符串并将其
提取
出来,但我需要
图像
部分
的
帮助。如何读取
docx
文件
并在找到
图像
时发生事件?谢谢你
的
帮助!我
使用
浏览 2
提问于2011-06-14
得票数 6
2
回答
使用
python
从
.
docx
文件
中
提取
特定
的
表
和
图像
python
、
docx
、
python-docx
我正在尝试
从
word文档中
提取
一个
特定
的
表格,该表格紧跟在标题“缩写列表”之后,并在.
docx
文件
中
紧跟在标题“图形研究”之后
的
图像
。我已经能够
使用
python
-
docx
代码
提取
标题,但是如何
使用
标题或它们
的
位置解析文档来检索
图像
和我正在
使用
if re.match("Graphica
浏览 49
提问于2020-07-16
得票数 0
2
回答
是否有一种方法可以将内联形状
从
docx
中保存为
图像
文件
?
python
、
image
、
docx
、
shapes
我试图
使用
python
解析
docx
文件
。该
文件
包含
图像
和文本。基本上,我需要一种
从
文件
中
获取
图像
( InlineShape对象)
的
方法,并将其保存为单独
的
图像
(如"smth.jpg")。有办法吗?
浏览 1
提问于2019-07-11
得票数 0
回答已采纳
3
回答
在
Python
3
中
解析.
docx
python
、
ms-word
、
docx
、
python-docx
我目前正在编写一个
python
3程序,它可以解析
特定
的
docx
文件
,并从中
提取
文本
和
图像
。我一直在尝试
使用
,但它无法导入到我
的
程序
中
。我已经安装了lxml、Pillow
和
python
-
docx
,但它不能导入。当我试图
从
终端
使用
python
-
docx
时,我不能
使用</e
浏览 0
提问于2014-02-10
得票数 6
回答已采纳
1
回答
使用
python
计算word
docx
中
的
行及其值
python
、
python-3.x
、
pandas
、
numpy
、
python-docx
我有一个单词
docx
,它不包括桌子。每个
表
都有不同
的
行
和
列名,但是在所有不同
的
表
(即“测试自动化”)
中
,所有一行名称都是相同
的
,它
的
值为“是或否”。这里我
的
问题是,如何计算
使用
python
3.6
的
“测试自动化”行
的
总no值,如“测试AUTOMATION:yes=200,no=100
的
总NO”。我是蟒蛇新手,请帮帮我。我
的
浏览 3
提问于2017-10-11
得票数 1
回答已采纳
4
回答
如何
使用
python
从
docx
文件
中
提取
超链接
中
的
url
python
、
python-docx
我一直试图找出如何
使用
python
从
docx
文件
中
获取urls,但什么也找不到,我尝试过
python
-
docx
和
python
-
docx
2txt,但
python
-
docx
似乎只
提取
文本,而
python
-
docx
2txt能够
从
超链接中
提取
文本,而不是urls本身。
浏览 3
提问于2016-11-08
得票数 3
4
回答
如何
使用
Python
从
doc/
docx
文件
中
提取
数据
python
、
ms-word
、
docx
、
doc
我知道有类似的问题,但我找不到什么东西可以回应我
的
祈祷。我需要
的
是一种
从
MS-Word
文件
中
访问某些数据并将其保存在XML
文件
中
的
方法。在上阅读是没有帮助
的
,因为它似乎只允许一个人写入word文档,而不是阅读。要准确地呈现我
的
任务(或者我选择如何处理我
的
任务):我想搜索文档
中
的
关键字或短语(文档包含
表
),并从找到关键字/短语
的<
浏览 10
提问于2014-03-31
得票数 10
回答已采纳
1
回答
如何
从
.
docx
文件
中
的
表
中
提取
文本?
python
、
docx
、
python-docx
我希望
使用
python
从
.
docx
文件
中
的
表
中
提取
文本,以便进行进一步分析。我
使用
以下代码:tables = document.tables forrow.cells:
浏览 1
提问于2018-03-05
得票数 0
回答已采纳
1
回答
从
docx
文件
中
提取
特定
字体
的
文本
python
、
python-3.x
、
docx
、
python-docx
我
使用
Python
3.4
和
python
-
docx
库来处理.
docx
文件
。我已经能够
从
文档中
提取
文本。但我
的
目标是只
提取
那些具有
特定
字体
的
文本(并修改它们)。在过去
的
两天里,我一直在
中
搜索这个,但是没有结果。 这里有没有人对这个库有经验,如果有,他们能给我指出正确
的
方向吗?
浏览 1
提问于2014-09-01
得票数 4
1
回答
.
docx
数据、
图像
和
结构
的
提取
python
、
python-docx
今天好, 例如,我是否能够获得下面文档结构
的
数组?
docx
import Document document =
docx
.Document('demo.
docx</
浏览 0
提问于2019-08-19
得票数 0
回答已采纳
2
回答
使用
python
-
docx
搜索
和
替换后丢失格式
和
图像
python
、
docx
、
python-docx
专家们,搜索
和
替换工作正常,但输出
文件
丢失了所有
图像
和
格式。你知道哪里出了问题吗?我所做
的
只是修改了example-makedocument.py,并将其替换为我
的
docx
<e
浏览 10
提问于2013-05-10
得票数 2
2
回答
如何在
python
或R中将.
docx
文件
中
的
表
转换为.xlsx或csv
文件
?
r
我有一个类似下面提到
的
文档。在表格上方有一些文本,然后是一个表格。如何
从
R或
python
中
的
docx
文件
中
提取
表格,然后将其转换为csv
文件
或xlsx
文件
。我甚至不介意.txt
文件
保留
表
的确切格式。我只是不知道如何处理这个文档
文件
。
浏览 1
提问于2016-03-18
得票数 2
3
回答
复制.
docx
文件
的
一部分(保留格式
和
图像
)
python
、
python-docx
日安所以,我试过
python
-
docx
,但是我找不到任何关于图片
的
东西。链接到我之前
的
qn: 有没有办法复制文档
的
一部分,比如说DocA,并将其插入到DocB
的
结尾(包括
图像
浏览 122
提问于2019-08-20
得票数 2
1
回答
我们可以
使用
python
在
docx
文件
中找到
特定
的
单词吗?
python
、
ms-word
、
docx
、
python-docx
、
word-frequency
我尝试过
使用
python
-
docx
模块。到目前为止,我已经能够
从
word
文件
中
提取
特定
段落以及整个文本。pip install --pre
python
-
docx
#to install
python
-
docx
from
docx
import Document docume
浏览 12
提问于2019-06-04
得票数 1
1
回答
如何
从
python
的
docx
文件
中
提取
超链接文本?
python
、
docx
、
python-docx
我正在处理
的
docx
文件
有一个带有注释
的
超链接。带有学生成绩
的
-
文件
from
docx
import Do
浏览 2
提问于2022-07-27
得票数 0
2
回答
如何用
docx
库
从
MS Word文档
中
的
表格中
提取
图像
?
python
、
xml
、
ms-word
、
docx
、
python-docx
我正在开发一个程序,它需要从MS Word文档中
提取
两个
图像
,以便在另一个文档中
使用
它们。我知道
图像
的
位置(文档
中
的
第一个
表
),但是当我试图
从
表
中
提取
任何信息(甚至是纯文本)时,我会得到空单元格。我想从中
提取
图像
的
。我想从第一页
提取
'Rentel‘
图像
(第一个
表
,第0行
和</
浏览 5
提问于2019-10-25
得票数 1
回答已采纳
2
回答
Pandoc将
docx
转换为带有嵌入
图像
的
markdown
pandoc
将.
docx
文件
转换为markdown时,不会
从
docx
归档中
提取
嵌入
的
图像
,但输出
中
包含![](media/image1.png){width="6.291666666666667in" height="3.1083333333333334in"} 是否有需要设置
的
参数才能
提取
嵌入
的
图片?
浏览 3
提问于2016-10-10
得票数 49
回答已采纳
1
回答
解析HTML
文件
,并将标题<h1>
和
副标题<h2>以及它们下面包含
的
文本存储在其他
文件
目录
中
(
Python
)
python
、
pandas
、
beautifulsoup
、
html-parsing
、
python-docx
我实际上将我
的
.
docx
文档转换为超文本标记语言,因为我希望所有的标题
和
副标题都存储在单独
的
文件
中
,因为稍后我想要重现相同
的
文件
(但删除一些内容),所以我
的
想法是,我将解析一次超文本标记语言,并存储它
的
所有标题
和
子标题一次有没有人可以指导我
使用
哪个库,或者有没有一种我可能不知道
的
更简单、更聪明
的
方法?请给我引路。 非常感谢。some text s
浏览 4
提问于2020-05-28
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
分享5个开源文本文档处理工具
CTF取证类题目指南鹏越·学霸专区
python玩转PDF文档
Python基础教程之Python爬虫工具列表详解
要成为一个专业的爬虫大佬,你还需要了解这些
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券