腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(7521)
视频
沙龙
1
回答
从
pptx
、
ppt
、
docx
、
doc
和
msg
文件
中
提取
文本
python
windows
、
、
有没有办法
从
windows
机器上的
pptx
,
ppt
,
docx
,
doc
和
msg
文件
中
提取
文本
?我有几百个这样的
文件
,需要一些编程的方式。我更喜欢
Python
。但我对其他建议持开放态度。
浏览 11
提问于2018-08-22
得票数 1
回答已采纳
2
回答
用Java
从
Office
和
PDF
文件
中
提取
文本
、
、
、
、
我有一个.pdf,
ppt
,
pptx
,xls,xlsx,
doc
和
.
docx
FilesList<File>的列表,现在我想在这个
文件
中
查找电子邮件地址。我的问题是如何从这些
文件
中
智能地
提取
计划
文本
。目前,我正在使用Apache,对于每种类型的
文件
,我都有一种单一的方法,这样做是否有更短、更优雅的可能性呢?也许还可以处理.odt、.odp、.ods
文件
?如
浏览 4
提问于2015-12-07
得票数 0
回答已采纳
1
回答
如何限制UIDocumentPicker在iOS 14.0 swift
中
添加.sh可执行
文件
?
、
, .html, .pdf, .xml, .presentation, .jpeg, .bmp, .gif, .png, .tiff, .content]这些UTTypes,但仍然能够附加.sh类型的
文件
,我如何通过仍然支持
文本
和文档
文件
来限制可执行
文件
。此外,UTType没有为.
doc
、.
docx
文件
指定类型
浏览 3
提问于2021-08-03
得票数 0
3
回答
使用java
从
doc
中
提取
嵌入式
文件
、
我正在使用poi库来处理MS
文件
。为了
提取
docx
、xlsx
和
pptx
的嵌入ole对象,我使用了方法:PackagePart pp = src.getAllEmbedds(),但是对于旧格式的MS
文件
,如
doc
、xls
和
ppt
,则没有这样的方法所以我使用的是
提取
器:POITextExtractor[] embeddedExtractors = ExtractorFactory.getE
浏览 8
提问于2014-01-29
得票数 1
回答已采纳
1
回答
通用PDF转换器
、
、
、
、
我正在寻找一个“任何文档转换器”的帮助,其中任何文档
文件
文档,
docx
,
ppt
,
pptx
将转换为pdf。
DOCX
和
PPTX
很容易使用
python
库,但是
DOC
和
PPT
有点棘手。/dstpaths" ext = ['
ppt
', '
pptx
', '
doc
', '
浏览 18
提问于2022-05-17
得票数 -1
回答已采纳
3
回答
解析Microsoft Office
和
PDF文档的最佳方法是什么?
、
、
、
、
我正在开发一个使用VB9 (VS2008)
和
Lucene.NET的桌面搜索引擎。Lucene.NET
中
的索引器只接受原始
文本
数据,不能直接
从
Microsoft Office (
DOC
,
DOCX
,
PPT
,
PPTX
)
和
PDF文档中
提取
原始
文本
。从这样的
文件
中
提取
原始
文本
数据的最佳方法是什么?
浏览 2
提问于2009-01-21
得票数 7
回答已采纳
1
回答
在
Windows
7上
从
MS Word/
PPT
2010
提取
后,嵌入式
文件
会损坏
、
当我
提取
一个嵌入到MS Word (
docx
) /
PPT
(
pptx
)
文件
(复制
和
粘贴桌面上嵌入的
文件
对象)
中
的对象的
文件
时,所
提取
的
文件
将被破坏。(一些垃圾字符在
文件
开始时追加,而
文件
末尾缺少某些字符)。
Windows
7上的Office 2010
浏览 1
提问于2014-01-07
得票数 0
1
回答
如何将BIRT报表工具限制为仅将报表导出为PDF格式
、
我已经将我的Version-3.2.20应用程序中使用的Birt报告工具
从
Version-4.3.20迁移到了Version-4.3.20,方法是用birt-runtime-osgi-4_3_2,提供的新jar
文件
替换应用程序
中
的旧jar
文件
,它运行良好。XLS_SPUDSOFT ,但是
和
pdf一起显示了XLSX
和
还可以导出报表的选项,我找不到这两个相关的jars,如何限制它们。请帮我这个忙。谢谢:)
浏览 8
提问于2014-05-22
得票数 1
回答已采纳
3
回答
用
Python
将
ppt
文件
转换为
pptx
、
、
有任何方法将.
ppt
文件
转换为.
pptx
文件
.我将.
ppt
文件
转换为pdf,然后使用PDFminer
从
pdf中
提取
数据。
从
pdf中
提取
的
文本
不被任何分隔符分隔。因此,很难区分表
中
浏览 3
提问于2017-08-14
得票数 8
1
回答
python
-
pptx
无法
从
某些Powerpoint演示文稿中
提取
文本
,但其他演示文稿可以正常工作
、
、
、
在尝试
从
.
pptx
文件
的大型目录中
提取
文本
字段时,下面的脚本非常适合某些Powerpoint演示文稿:import glob 然而,在其他许多(看起来非常大的)上,我收到了这个巨大的错误墙: File "C:\Users\GLD-POS3\Desktop\SIGNS\
PPT
_Scraper.py:\Users\GLD
浏览 1
提问于2020-04-04
得票数 0
3
回答
用于
从
本地系统搜索所有.
doc
和
.
docx
文件
的java代码
、
、
、
我正在使用java的
windows
版本的桌面应用程序
中
工作。在我的应用程序
中
,需要搜索MyDocuments/Documents
中
的所有.
doc
和
.
docx
文件
(根据O.S.)
从
本地系统并显示其中的名称和
文件
大小。我没有办法列出Documents/MyDocuments
中
存在的所有*.
doc
、*.
docx
、*.xls、*.xlsx、*.csv、
浏览 1
提问于2010-11-10
得票数 5
回答已采纳
2
回答
PowerPoint演示文稿幻灯片的数量?
、
、
、
计算某个目录中所有.
docx
、.
doc
、.
ppt
、.
pptx
和
.pdf
文件
的总页数;但我对如何计算PowerPoint幻灯片有点困惑。Presentation.Close() powerpoints = glob('*/*/*.
pptx
') + glob('*/*/*.
浏览 2
提问于2013-06-11
得票数 3
回答已采纳
1
回答
Apache POI -如何将XSSFWorkbook写入POIFSFileSystem?
、
我试着
从
XSSFWorkbook创建ByteArrayInputStream,如下所示-FileOutputStream stream = new FileOutputStream("test.xlsx");当我
提取
并比较xlsx
文件
时,没有区别。但是,当我直接对xlsx
文件
进行纯
文本
浏览 2
提问于2011-07-06
得票数 1
回答已采纳
1
回答
适用于多种
文件
类型的IFilter或SDK?
、
、
、
、
有没有人知道.NET
中
的API/SDK或IFilter可以
从
以下
文件
中
读取主题(‘标题’元数据)和
文本
: .PDF .
DOC
.XLS .
PPT
.CSV .TXT .
DOCX
.XLS .
PPTX
+OpenOffice
和
开放文档标准。
浏览 6
提问于2009-10-08
得票数 1
2
回答
如何
从
powershell
中
的扩展名数组中
提取
/匹配
文件
类型扩展名
、
我只想使用Powershell
从
Sharepoint库中
提取
所需的
文件
类型请帮我更正一下剧本。$libfiles = ".
pptx
",".xlsx",".xls",".
docx
",".
doc
",".pdf",".jpeg","
浏览 2
提问于2016-10-25
得票数 2
回答已采纳
1
回答
在
PPT
中
获取word文档计数
和
幻灯片数量
、
、
、
是否有可能获得word文档
中
的页数或一个
ppt
中
的幻灯片数?我正在积极地寻找一些解决方案,但我无法得到一个解决方案。任何帮助都将是非常感谢的。
浏览 1
提问于2014-04-10
得票数 1
回答已采纳
2
回答
从
pptx
中
提取
超链接
、
、
我想从
pptx
中
提取
超链接,我知道如何在word
中
实现,但是有谁知道如何
从
pptx
中
提取
它呢?例如,我在
pptx
中有一个
文本
,我想得到url : from
pptx
import Presentation
ppt<
浏览 5
提问于2021-04-22
得票数 3
回答已采纳
2
回答
寻找用于
从
ppt
、
pptx
、
doc
、
docx
文件
中
解析
和
提取
对象的库
、
、
、
、
我正在寻找一个库,可以打开一个
ppt
,
pptx
,
doc
,
docx
文件
,解析它,并从中
提取
所有的对象。我已经尝试过来做这件事,但它在获取这些
浏览 0
提问于2011-01-21
得票数 2
回答已采纳
1
回答
使用php将用户输入的时间添加到
文件
名并上载到特定
文件
夹。
我想上传
文件
到cloud.there是3个
文件
夹在云中,如P1,P2
和
P3。我上传图像(所有格式),音频
文件
,视频
文件
,
ppt
,
pptx
,
doc
,
docx
,pdf和
文本
文件
。为jpeg映像J1_YYYYMMDDHHMMSS_YYYYMMDDHHMMSS.jpg
和
第二个jpeg img生成J2_YYYYMMDDHHMMSS_YYYYMMDDHHMMSS.jpg等
文件
浏览 1
提问于2014-03-28
得票数 0
1
回答
在
Windows
操作系统中将
文件
上传到React应用程序
中
时,空Mime类型
、
、
、
、
type="file" className="form-control" multiple onChange={this.onChangeHandler} />这段代码在lynux os
中
运行良好,用于上行(
doc
和
docx
)
文件
:
从
Ubuntu机器上传
docx
文件
的示例输出如下: lastModified: 158596977
浏览 5
提问于2020-04-19
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券