腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
一个
函数
中
从
doc
和
docx
文件
中
抓取
文本
python
、
docx
、
doc
、
python-docx
我正在遍历链接到
docx
、
doc
和
pdf
文件
的urls列表。我编写了
一个
函数
,它允许我
从
docx
文件
中提取
文本
并将其附加到
一个
新列表
中
。我对pdf
文件
不感兴趣,但我也想从同一
函数
中
的
doc
文件
中提取
文本
。 经过一些研究,似乎textract被大多数人推荐用来下载文档和文档<e
浏览 16
提问于2019-05-14
得票数 0
5
回答
在
拼音
中
打开.
doc
文件
ruby-on-rails
、
ruby
、
ms-office
我可以打开
一个
.
doc
文件
并使用Ruby获取该
文件
的内容吗?
浏览 4
提问于2011-06-01
得票数 12
1
回答
Ms Word的样式
在
R Markdown
中
不起作用
r
、
r-markdown
我已经尝试过从标记
中
设置MS Word文档的样式,但我似乎没有把它写出来。我做错了什么?: "Test Document"date: "05/04/2021" word_document:--- ```{r setup, include=FALSE} knitr::opts_chunk$set(e
浏览 22
提问于2021-04-05
得票数 1
1
回答
从
pptx、ppt、
docx
、
doc
和
msg
文件
中提取
文本
python windows
python
、
powerpoint
、
docx
有没有办法
从
windows机器上的pptx,ppt,
docx
,
doc
和
msg
文件
中提取
文本
?我有几百个这样的
文件
,需要一些编程的方式。我更喜欢Python。但我对其他建议持开放态度。
浏览 11
提问于2018-08-22
得票数 1
回答已采纳
1
回答
仅从.
docx
文件
中提取特定字体类型的
文本
。
python
、
docx
我想从我的.
docx
文件
中提取'Arial‘类型的所有
文本
。这是我目前所拥有的,但它没有产生任何输出(文档
中
的大多数
文本
都是‘Arial’类型的)。from
docx
import * for paragraph in document.paragraphs: for run
浏览 8
提问于2022-05-25
得票数 2
回答已采纳
5
回答
从
.
docx
文件
中
获取数据,就像C#
中
的
一个
大字符串
c#
、
.net
、
office-interop
、
docx
我想从.
docx
文件
中
从
C#代码
中
读取类似数据的字符串.我看了看其中的一些问题,但不知道该用哪
一个
。Application = new ApplicationClass();,但我得到了 类型'Microsoft.Office.Interop.Word.ApplicationClass‘没有定义构造
函数
我想从我的
docx
文件
中
得到完整的
文本
,而不是分开的单词!= wo.Docum
浏览 9
提问于2012-06-11
得票数 1
回答已采纳
1
回答
Python
docx
模块- word文档的封面
python-3.x
我正在处理
一个
现有的word报告,并试图用python
docx
模块做一些自动化操作。我需要从数据库
中
获取报告日期,并将其粘贴到文档的“封面”
中
,但我
在
模块
中
找不到任何有关封面的属性。我该怎么做呢?
浏览 2
提问于2019-07-29
得票数 0
1
回答
如何
从
.
doc
和
.
docx
文档
中
读取纯
文本
并在Flex3
文本
区显示
actionscript-3
、
apache-flex
、
file-io
、
flex3
我们正在开发
一个
客户关系管理应用程序,为此,我们需要上传*.
doc
和
*.
docx
文件
并显示这些内容。我们使用FileReference
和
FileReferenceList成功上传了应用程序
中
的*.
doc
和
*.
docx
文件
。你能告诉我一些想法,
从
*.
doc
和
*.
docx
文件
中
读取内容,并将上传的
浏览 1
提问于2012-03-21
得票数 0
7
回答
如何
从
.
doc
和
.
docx
文件
中提取纯
文本
?
unix
、
extract
、
docx
、
doc
、
text-extraction
为了
从
.
doc
或.
docx
中提取纯
文本
,任何人都知道他们可以推荐的方法 我找到了 --不知道还有没有其他建议?
浏览 2
提问于2011-04-15
得票数 53
7
回答
PhpWord不会替换
文本
php
、
docx
、
phpword
我有
一个
docx
文件
,我需要替换一些
文本
。这是
在
codeigniter框架
中
完成的;以下是代码:$template = $this->word->loadTemplate/
doc
/assets/
doc
3.
docx
'); $template->setValue('
浏览 4
提问于2013-05-28
得票数 11
1
回答
循环遍历
文件
,然后在编辑后关闭
python
、
docx
、
python-docx
我正在尝试这样做:待定数量的
文本
文件
将在
一个
文件
夹
中
,我想: 1.一次打开
一个
文件
,然后打开两个。为特定的字符串读取
文件
中
的
文本
,然后将
文本
文件
的全部内容附加到
docx
文件
中
,并在步骤2
中
保存为字符串的名称。
在
文件
夹
中
重复下面的
文本
浏览 5
提问于2020-06-16
得票数 0
回答已采纳
2
回答
从
pdfs和文档中提取
文本
和
元数据
javascript
、
python
我正在做
一个
抄袭检查作为
一个
附带的项目。我想知道如何
从
文档such as bold text or big titles中提取
文本
和
相关元数据的方法。我计划支持pdf
和
ms
文件
。 那么,我如何
从
文件
中提取所需的数据呢?
浏览 11
提问于2020-10-22
得票数 0
回答已采纳
10
回答
是否将Word文档或
docx
文件
转换为
文本
文件
?
perl
、
vba
、
text-files
、
docx
、
doc
我需要一种方法来转换.
doc
或.
docx
扩展到.txt,而不需要安装任何东西。显然,我也不想手动打开Word来做这件事。只要它是
在
自动上运行的。
浏览 0
提问于2009-07-10
得票数 13
回答已采纳
1
回答
用PHP LINUX统计
DOC
和
DOCX
中
的字符
php
、
libreoffice
、
centos6.5
另外:我发现计算行数最接近的方法是对
DOC
文件
使用linux命令" antiword“,antiword将返回
DOC
的
文本
版本;而对于
DOCX
使用
一个
调用,它将从
DOCX
检索内容并通过与antiword相同的
文本
函数
推送数据。附注: 我曾尝试将
doc
和
docx
转换为txt,但结果“页眉”
和
“页脚”区域没有保留在txt文档
中
。此外,我找到
浏览 6
提问于2015-02-11
得票数 2
7
回答
python
docx
.opc.exceptions.PackageNotFoundError:打开文档时未找到包
python
、
docx
我想用Document()
函数
打开
一个
.
docx
文件
。但它总是返回:但是,当我将
函数
更改为open()时,它工作得很好。from
docx
浏览 0
提问于2017-04-24
得票数 12
2
回答
从
FileUpload上传的MS Word文档中提取
文本
python
、
jupyter-notebook
我试图允许用户上传MS
文件
,然后运行
一个
以字符串作为输入参数的
函数
。我正在通过FileUpload上传Word
文件
,但是我得到了
一个
编码对象。我无法使用字节UTF-8进行解码,而使用upload.value或upload.data只能返回编码的
文本
。 有什么想法可以从上传的Word
文件
中提取内容吗?
浏览 4
提问于2020-04-05
得票数 1
回答已采纳
1
回答
将html内容转换为
docx
文件
c#
、
asp.net
我
从
stringBuilder
中
获取数据并将其放入.
docx
文件
中
。对于.
doc
扩展,我们可以直接使用stringBuilder。但是对于.
docx
文件
,有
一个
问题。 FileStream stream
浏览 0
提问于2012-01-19
得票数 2
2
回答
编写多个
docx
的语言/记者循环
r
、
docx
我正在尝试(尽我所能)创建
一个
脚本,该脚本将使用R语言和记者
从
纯
文本
文件
中生成格式化的word文档。为了从
一个
txt中提取
文本
,我使用了在这个线程上找到的代码:con <- file(fileName,open="r")close(con) 然后将提取的
浏览 3
提问于2017-04-14
得票数 0
回答已采纳
3
回答
在
C#
中
阅读word文档
c#
、
asp.net
、
ms-word
、
ms-office
我想在服务器
中
读取word文档(包括
doc
和
docx
)。服务器没有安装office,所以我不能使用com对象,也没有商业软件。有没有办法让我可以单独使用office工具
和
阅读word docs (2003
和
2007)
浏览 2
提问于2011-02-27
得票数 2
1
回答
检查XWPFRun是否高亮显示
java
、
apache-poi
、
xwpf
对于Apache,我正在阅读Word文档,包括
doc
和
docx
。旧的CharacterRun for
doc
有
一个
isHighlighted
函数
,它告诉我是否高亮显示
文本
。对于
docx
文件
,XWPFRun有等效的
函数
吗?
浏览 0
提问于2015-11-04
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 读取各类文件格式的文本信息
doc和docx有什么区别
掌握这6种方法,Python提取Word图片轻轻松松,手拿把掐!
利用Python好好的整理你的附件
Python实现自动化Word排版
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券