腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
python
-
从
microsoft
word
中
提取
文本
、
我正在尝试
提取
MS
word
文档(link)
中
特定部分的
文本
-示例如下。基本上,我需要将带有标记-- ASN1START和-- ASN1STOP的所有
文本
写到一个文件
中
,上面提到的标记除外。示例
文本
-- ASN1START rrc-TransactionIdentifier RRC-TransactionIdentifier我需要帮助
提取
只在标
浏览 13
提问于2020-01-15
得票数 1
回答已采纳
1
回答
使用
python
显示docx文件的内容
、
我想在docx
中
显示数据。但是我下面的代码是
提取
文本
和打印it.Can,有人建议我怎么做呢?在这里,我的表
中
的
文本
正在显示,但没有显示表。这里能做些什么?
浏览 2
提问于2019-09-23
得票数 1
1
回答
使用pyUNO
从
Office文档中
提取
宏
、
、
、
我有一个嵌入了宏的
Microsoft
Word
文档。我已经设法使用这个示例加载了一个文档那么,如何使用
Python
UNO
从
文档中
提取
宏
文本
呢?
浏览 3
提问于2014-05-26
得票数 0
2
回答
从
pdfs和文档中
提取
文本
和元数据
、
我想知道如何
从
文档such as bold text or big titles中
提取
文本
和相关元数据的方法。 我将使用
python
或javascript,并在每种语言上使用框架。那么,我如何
从
文件中
提取
所需的数据呢?
浏览 11
提问于2020-10-22
得票数 0
回答已采纳
2
回答
使用ASP.NET
从
word
文档
中
获取
文本
框值?
、
、
、
我有一个用ASP.NET(C#)编写的非常基本的web应用程序和一个包含
文本
框和下拉列表的基本
Microsoft
Word
(2007)文档。在我的web应用程序代码隐藏文件
中
,我想按名称调用textbox控件和dropdown控件,并从中
提取
值。我在网上找到的任何文档都只是简单地读写
word
文档,但我似乎找不到任何关于访问控件和
从
控件中
提取
值的内容。这是我目前唯一能处理
word
文档的代码。AND DOC
浏览 0
提问于2013-08-14
得票数 2
1
回答
使用Scrapy
从
Python
中
提取
Microsoft
Word
文件
中
的
文本
、
、
、
、
这是我的示例代码,使用
Python
提取
word
.doc和一个
从
网站
提取
的.docx文件。请检查它,并让我知道如何实现此代码…(C) Copyright 1985-2001
Microsoft
Corp._startRunCallbacks(result) File "C:\
Python
27\lib\site-packages\twisted\internet\d
浏览 0
提问于2014-09-05
得票数 0
3
回答
仅从剪贴板获取可读
文本
、
我已经知道如何在Java语言中
从
剪贴板
中
获取纯
文本
,但有时
文本
会被编码成一些奇怪的DataFlavor,比如从
Microsoft
Word
或网站复制,甚至
从
Eclipse复制源代码。如何从这些DataFlavor中
提取
纯
文本
?
浏览 6
提问于2011-08-18
得票数 59
回答已采纳
1
回答
如何避免PyPDF
中
裁剪部分的
文本
?
、
我对
python
非常陌生,我正在做一个ML项目,
从
PDF(已发布的年度报告)中
提取
披露信息。PyPDF
提取
了我的项目所需的信息,但它也包含了我想要删除的
文本
中
的页脚
文本
。但是,当我在原始代码
中
运行已裁剪的PDF时,来自页脚的
文本
仍然包含在
提取
的
文本
中
。不管怎么说我能克服这一切吗?
浏览 5
提问于2022-10-14
得票数 1
回答已采纳
2
回答
使用SSIS将
Word
文档
中
的数据
提取
到ETL
中
、
、
、
、
在如何使用SSIS
从
Word
文档中
提取
数据以及在SQL
中
插入
提取
的数据方面,我确实需要一些帮助。有10,000 -13,000个字文件需要处理。这些年来,这些文件很可能不一致。下面是我感兴趣的
Word
文档
中
的示例数据。请注意,Date和Job No位于标头部分。
浏览 12
提问于2022-03-16
得票数 1
1
回答
快速读取文档文件c#
、
我想从.doc文件中
提取
文本
,我使用以下代码object path = FileToSave_path + FileNameToSave + ".doc"; object readOnly = t
浏览 4
提问于2015-07-11
得票数 1
回答已采纳
1
回答
如何在C#中使用
Microsoft
.Office.Interop.
Word
逐页获取
word
文件(.Docx)
中
的
文本
、
、
、
、
我想在C#中使用
Microsoft
.Office.Interop.
Word
逐页
从
.DOCX文件中
提取
文本
。目前,我正在通过下面提到的方法获取文件的所有
文本
,但是我想逐页获取,那么我该如何做呢 {
Microsoft
.Office.Interop.<em
浏览 0
提问于2015-03-25
得票数 1
1
回答
如何将varbinary doc作为HTML打开
、
、
我将
word
文档恢复存储为var二进制文件(最大)。我可以根据全文检索简历-没问题。但是,简历是以
word
文档的形式在.ashx文件
中
检索的,代码如下。我不认为这可以
从
.ashx文件
中
完成,所以我认为我需要能够在aspx页面
中
以html的形式打开简历,或者使用javascript来进行点击高亮显示,或者以某种方式返回
word
文档的
文本
内容,并在使用html标记显示之前对
文本
进行操作。
浏览 2
提问于2011-01-25
得票数 0
1
回答
用
Python
语言
从
Word
文档(.docx)中
提取
突出显示的单词
、
、
、
我正在处理一堆
word
文档,其中的
文本
(单词)被突出显示(使用颜色代码,例如黄色、蓝色、灰色),现在我想
提取
与每种颜色相关联的突出显示的单词。我正在用
Python
编程。以下是我目前所做的工作:#!= document.xpath('//w:r', namespaces=document.nsmap) for <em
浏览 3
提问于2012-03-05
得票数 3
回答已采纳
21
回答
PHP输出显示带有问号的小黑菱形
、
、
我正在写一个php程序,可以
从
数据库源中
提取
数据。其中一些varchars的引号显示为带有问号的黑色菱形(我
从
Microsoft
Word
文本
中
假定为、�)。 如何使用php剥离这些字符?
浏览 1
提问于2008-11-09
得票数 86
1
回答
UFT
中
如何
从
洞察对象中
提取
文本
假设我们有如下所示的洞察力对象:”)如何
从
“InsightObject_Example”中
提取
文本
?
浏览 0
提问于2014-04-11
得票数 1
1
回答
从
Word
表单拉取数据
、
、
使用C#时,我需要从
word
文档中
提取
数据。我已经在项目中安装了
word
的NetOffice。数据分为两部分。其次,我需要拉出文档
中
控件的内容。现在,我已经获得了以下代码来
从
文档中
提取
平面
文本
: { NetOffice.WordApi.ApplicationwordApplicati
浏览 4
提问于2015-04-21
得票数 1
1
回答
我可以使用
Microsoft
.Office.Interop.
Word
.dll进行
word
自动化吗?
、
我有多个
word
文档。我想从所有的关键字
从
所有
word
文档中
提取
一些部件,并需要将所有
提取
的部件写到java
中
的单个输出
word
文档
中
。使用
Microsoft
.Office.Interop.
Word
.dll可以做到这一点吗? 如何在java中使用
Microsoft
.Office.Interop.
Word
.dll?
浏览 1
提问于2014-07-21
得票数 0
3
回答
解析
Microsoft
Office和PDF文档的最佳方法是什么?
、
、
、
、
Lucene.NET
中
的索引器只接受原始
文本
数据,不能直接
从
Microsoft
Office (DOC,DOCX,PPT,PPTX)和PDF文档中
提取
原始
文本
。从这样的文件中
提取
原始
文本
数据的最佳方法是什么?
浏览 2
提问于2009-01-21
得票数 7
回答已采纳
2
回答
如何:使用C#
从
Word
文档页脚
中
删除
文本
、
、
、
、
我试图使用C# 4
从
Word
文档
中
删除一个页脚。网页2012年4月18日 第一页(2012年4月18日) 2012年4月18日 Dim rngFtr As Range Set rngFtr = ActiveDocument.Sections下面是我在C# 4<e
浏览 5
提问于2012-04-19
得票数 1
回答已采纳
2
回答
如何
从
MS-
Word
文档文件中
提取
文本
数据
、
所以我只想知道有没有免费的库可以用来
从
doc或docx文件中
提取
文本
数据,它可以在所有ms-
word
版本的情况下工作,如果ms-
word
没有安装在pc上也可以工作。我在谷歌上搜索,发现一些文章
从
文档文件中
提取
文本
数据,但我不确定它们在所有ms-
word
版本的情况下是否有效。所以,请指导我的信息,我应该使用哪个库
从
ms-
word
提取
数据,不管ms-
word
的版本,也
浏览 1
提问于2013-02-13
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用Python从PDF文件中提取文本词汇
Python提取Word文档中所有超链接地址和文本
Python批量提取Word文件题库中的答案
Excel中批量提取摘要文本
如何在 Microsoft Word 中打开 PDF
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券