腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如
何用
python
而
不是
Docx
读取
doc
文件
python
、
doc
我正在尝试用
python
读取
.
doc
文件
,但由于对操作系统的依赖性,我不想使用textract。此外,我不想使用
docx
2txt,因为据我所知,它不
读取
.
doc
,
而
只
读取
.
docx
文件
。
浏览 44
提问于2021-01-18
得票数 0
2
回答
从.
doc
(非
docx
)中提取文本
python
、
doc
我在stackoverflow和其他中检查了很多问题和答案,有很多方法可以打开和
读取
.
docx
文件
,
而
不是
用
python
我已经检查过
python
-
docx
库,但它只支持
docx
。我想打开并提取.
doc
文件
(
不是
docx
)中的文本。请帮帮我,因为我是
python
新手
浏览 0
提问于2017-04-20
得票数 1
1
回答
UnicodeDecodeError正在窗口显示.如何解决这个问题?
python
、
python-3.x
、
file
我只是从一个
文件
中
读取
,但为什么会出现错误呢?怎么摆脱它?
浏览 4
提问于2020-06-01
得票数 1
回答已采纳
1
回答
预处理用于NLP的.txt
文件
python-3.x
、
nlp
我有上百个非结构化的.txt
文件
(文章)需要进行预处理,我必须先将.txt
文件
转换为.csv
文件
吗?或者我可以开始清理原始文本
文件
吗?如果是这样的话,有没有人能帮我用
Python
进行批处理
文件
类型转换?
浏览 8
提问于2019-05-03
得票数 0
2
回答
python
-
docx
:‘未找到包’
python
、
python-docx
我在‘/var/
doc
.
docx
/oa’中有一个代码
文件
。我需要使用
python
-
docx
来
读取
它。我这样写:document = Document('/var/code/oa/
doc
.
docx
') 然后,有错误..PackageNotFoundError:在'/var
浏览 0
提问于2014-09-01
得票数 9
1
回答
在
Python
3.7中,如何直接从URL链接
读取
.
docx
或.
doc
文件
,
而
不将其下载到本地系统?
docx
、
python-3.7
我已经用
Python
3.7构建了一个简历解析代码,但是我想直接从URL链接(例如http://13.234.163.240/storage/userData/phpjsK4iJ.
docx
)
读取
.
docx
或.
doc
简历
文件
,
而
不是
将其下载到我的本地系统。
浏览 37
提问于2019-04-26
得票数 0
2
回答
如何判断
文件
在POI中是
doc
还是
docx
?
java
、
ms-word
、
apache-poi
但是我发现,对于扩展名为
doc
(本质上是
docx
文件
)的某个
文件
,如果使用winrar打开,您将找到xml
文件
。众所周知,
docx
文件
是由xml
文件
组成的zip
文件
。我相信这个问题一定
不是
很少见。显然,从扩展名来判断
读取
doc
或
docx
是不合适的。 在我的情况下,我得看很多
文件
。我甚至会在一个压缩
文件
中
读取
<
浏览 5
提问于2017-11-25
得票数 4
回答已采纳
2
回答
在
Python
中将
doc
/
docx
文件
转换为pdf
python-3.x
、
pdf-conversion
有没有好的库可以把
doc
文件
转换成pdf
文件
?有一些付费选项,
如
cloudconvert,convertApi等,但我正在寻找一个免费的选项。我的
python
应用程序托管在EC2机器上。我还查看了
python
-
docx
库,它可以让我
读取
doc
文件
的内容,但我认为将内容写入pdf
文件
会破坏样式。
浏览 48
提问于2019-03-05
得票数 1
1
回答
如何使用
python
-
docx
模块
读取
'.
doc
‘
文件
python
、
python-3.x
、
aws-lambda
、
python-docx
、
doc
我正在尝试使用
python
-
docx
模块
读取
.
doc
文件
,我正在做
doc
=
docx
.Document(path) 这对.
docx
很有效,但对于.
doc
文件
会出现Value
浏览 6
提问于2021-02-16
得票数 0
1
回答
是否可以使用Zend_Service_LiveDocx
读取
.
doc
和.
docx
内容并将其转换为文本...?
php
、
zend-framework
、
file-format
、
zend-controller
我想
读取
(
而
不是
写入) .
doc
和.
docx
文件
,并需要从中提取文本。我尝试了很多方法,但有些方法只适用于.
docx
而
不适用于.
doc
请让我知道细节重新评分,如果有任何更多的方法,只是从.
docx
和.
doc
文件
读取
内容… 先谢谢你...
浏览 2
提问于2012-04-23
得票数 0
1
回答
MS Word抓取适用于
docx
,但不适用于
doc
文件
python
、
python-docx
我有下面的代码,它正在查看多个word
文件
,并将所有文本拉到每个
文件
的一行中。这对于
docx
文件
工作得很好,但是对于
doc
的
文件
却失败了。错误:
docx
.opc.exceptions.PackageNotFoundError: Package not found at 'C:\Users\xxx\sample.
doc
'
do
浏览 33
提问于2021-05-28
得票数 0
1
回答
尝试使用FastAPI和
python
库
读取
docx
文件
: AttributeError:“字节”对象没有属性“查找”错误
python
、
python-docx
、
fastapi
我正在使用FastAPI (
不是
异步)和
python
库,试图
读取
docx
文件
。我在试图
读取
docx
文件
时出错。(docFile.file.read())
doc
= Document(file) txt = tx
浏览 2
提问于2020-10-15
得票数 2
回答已采纳
3
回答
如何在Win 64上安装和使用
python
模块?
python
、
windows
、
visual-studio-code
我尝试过的(作为与vscode终端独立的命令):Git clone <git link>安装成功后,我将尝试从VS代码终端运行我粘贴了自述
文件
“使用”部分中的代码的
文件
:from simplify_
docx
import simplify # read in a documentmy_
doc
=
docx<
浏览 7
提问于2020-06-04
得票数 1
回答已采纳
1
回答
python
:在
docx
文件
中查找数字并替换
python
、
python-docx
我想在
python
中
读取
docx
文件
。然后从其中提取数字如下: text = t.readlines()a.append([int(s) for s in text.split
浏览 12
提问于2021-12-11
得票数 0
回答已采纳
1
回答
读取
.
doc
扩展名
文件
ElementTree
xml
、
python-2.7
、
docx
、
elementtree
、
doc
我已经使用使用.
docx
的ElementTree包成功地
读取
了zipfile
文件
。但我意识到,.
doc
文件
没有存档“.
doc
”。我查看了文档,但没有找到任何文档。如何
读取
?对于
docx
,我使用了:import xml.etree.ElementTree as ET
doc
_xmlnamed
浏览 21
提问于2014-09-15
得票数 1
回答已采纳
6
回答
如何使用
python
-
docx
从现有的
docx
文件
中提取文本
python
、
python-2.7
、
python-3.x
、
python-docx
我尝试使用
python
-
docx
模块(pip install
python
-
docx
),但这似乎非常混乱,因为在测试示例中,他们使用的是opendocx函数,而在中,他们使用的是Document类。即使他们只展示了如何将文本添加到
docx
文件
中,
而
不是
读取
现有的
文件
?from
docx
import Document d
浏览 172
提问于2014-08-10
得票数 60
2
回答
.txt -抓取
Python
中的所有文本并转储到
Python
中
text
、
python
、
parsing
我想知道如何编写
Python
脚本来执行以下步骤:(1)打开一个典型的.
docx
,(2)全选,(3)复制到剪贴板,(4)存储为字符串。 我不关心是否保留任何格式,也不关心图形,也不关心表格。
浏览 24
提问于2019-10-30
得票数 0
1
回答
Directory.GetFiles返回重复
文件
名
.net
、
directory
我正在运行System.IO.Directory.GetFiles("my_directory_name_on_network"),对于目录中的大多数11320
文件
来说,这是很好的,但是其中一个
文件
已经在其中两次了当我查看时,肯定只有一个
文件
。最后,我也在Windows中看到了这个问题。同一
文件
名在那里列出了两次。
浏览 0
提问于2012-10-15
得票数 4
2
回答
docx
.opc.exceptions.PackageNotFoundError
python
、
docx
、
python-docx
文档中的使用示例:但是有一个错误如果我这样做 print ("File exist") 它是print File
文件
与脚本位于同一目录中。我也试着使用Also fil
浏览 285
提问于2019-11-27
得票数 0
1
回答
使用
Python
在Word文档中插入Excel
文件
数据?
python
、
python-docx
我正在研究一些使用
Python
-
Docx
库在word文档中插入excel
文件
数据的算法。我将从项目中的某个位置
读取
该
文件
,然后将其作为一个对象插入到单词
docx
中。 我怎样才能做到这一点?
浏览 0
提问于2018-04-19
得票数 4
点击加载更多
相关
资讯
Python:读取.doc、.docx 两种 Word 文件简述及“Word 未能引发事件”错误
如何用Python读取Excel文件
Python:读取两种Word文件简述及文件未能引发事件错误
Python 批量调整 Word 样式
python 处理word文档实现自动化办公
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券