腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
6
回答
Python
使用
行
切换
提取
文本
python
、
parsing
、
line
我
使用
的是
Python
3.7,并且有一个如下所示的test.txt文件: <P align="left"> <FONT size="2">Prior</FONT> 我需要
提取
"be be“(第4
行
)到"per share”(第7
行
)之后的所有内容。
浏览 25
提问于2019-09-20
得票数 1
回答已采纳
1
回答
在
Python
docx中从.docx (Word)文件中读取头
python
、
openxml
、
python-docx
我正在
使用
库解析docx文件。我需要阅读文档的标题以及段落,但是我在他们的文档中找不到任何关于文档标题的内容。有关于将头文件写入新文件的文档,但没有关于读取头文件的文档。有没有办法做到这一点?
浏览 3
提问于2015-07-16
得票数 2
1
回答
JQuery显示从可见的HTML单元格中串联的
文本
列表
javascript
、
jquery
、
html
在每一
行
的第一个td中,都有一个农民的名字(例如,"farmer1“、"farmer2”等等)。因此,每一
行
代表不同农民的信息。假设出于某种合理的原因,某些
行
被隐藏。| 1 farmer4 | 0 | 1 | 0farmer2 farmer3 farmer4我无法理解的部分
浏览 2
提问于2015-02-03
得票数 0
回答已采纳
4
回答
使用
Python
从语料库中
提取
句子
python
、
python-2.7
我正在尝试
使用
Python
从
文本
中
提取
句子。
文本
中的每个单词都写在一
行
中,并带有与该单词相关的附加信息:loves Verb No-Name.我想要
提取
包含具有某些特定特征的单词的整个句子(例如,带有名称的句子)。 到目前为止,我只
提取
了感兴趣的单词,而不是整个句子。我
使用
.readlines()逐行阅读
文本
。然后,我循环遍历这些
行
,并
浏览 0
提问于2012-10-16
得票数 1
11
回答
高效地查找
文本
文件中的最后一
行
python
、
text
我需要从一些非常大(几百兆字节)的
文本
文件中
提取
最后一
行
来获取某些数据。目前,我
使用
python
遍历所有
行
,直到文件为空,然后处理返回的最后一
行
,但我确信有一种更有效的方法可以做到这一点。
使用
python
检索
文本
文件最后一
行
的最佳方法是什么?
浏览 14
提问于2011-08-24
得票数 50
1
回答
如何
提取
单元格格式(粗体、斜体、.)从Excel文件中
使用
Python
?
python
、
excel
、
format
我试图从Excel文件中
提取
单元格的内容(本质上是
文本
)和
文本
的格式。我正在处理的Excel看起来像下面的截图:单元格中的
文本
可能是粗体、斜体或笔画,我需要将
文本
和格式
提取
为
python
字符串。例如,如果单元格包含: - line 1 /n- **line 2**/n- *line 3** 以获取
浏览 1
提问于2018-07-04
得票数 4
1
回答
用
Python
阅读PDF摘要
python
我正在尝试用PDF阅读一些
Python
文档。它是否存在一个能够这样做的library?
浏览 0
提问于2019-02-27
得票数 0
1
回答
很多用于循环,但PyQT5输出
文本
python
、
pyqt5
我将从
Python
控制台
切换
到
Python
/Programm。我用的for loops有很多指纹。我用输出
文本
aka
切换
到PyQT5。date = data['data'][i]["date"] i += 1 我只有一个输出
文本
,现在我怎样才能只
使用
一个命令就能得到从for循环中得到的所有
浏览 7
提问于2022-07-12
得票数 1
回答已采纳
2
回答
当
使用
pipenv时,`tkinter._test()‘按钮是不可见的
python
、
tkinter
、
tkinter-macos
我正在MacOSX10.15.1 (Catalina)上运行这段代码"""在看到@ShayneLoyd的回答(建议我需要一个更新版本的
Python
和更新的Tk版本)之后,我开始寻找更多的,这意味着您可以
使用
自制的
Python
安装一个版本,链接自己安装的版本的Tk。一开始,我是这样运行的: $> cd ~/Source
浏览 7
提问于2019-11-07
得票数 4
回答已采纳
3
回答
文本
提取
项目-仅从PDF中
提取
特定
行
/项的最佳工具?
python
、
ruby
、
pdf
、
text
、
automator
我正在做一个项目,它将从pdf文档中
提取
指定的
文本
。我没有这种
提取
的经验。有一个问题是,我们不只是想转储文档中的所有
文本
。更确切地说,是否有一种方法只
提取
pdf中的某些字段?我正在尝试
使用
苹果的自动化-这是能够得到所有的
文本
,但没有指定的
文本
。理想情况下,我希望页面中的某个人有30
行
离散的
文本
,并将其中的20
行
指定为“目录项”,并让Automator脚本只
使用
这20
行</e
浏览 2
提问于2012-03-25
得票数 2
1
回答
提取
MS Word文档格式元素以及原始
文本
信息
python
、
ms-word
、
python-docx
在 @mikemaccana中,描述了如何
使用
从
python
内部的MS文档中
提取
原始
文本
数据。我想再走一步。除了简单地
提取
原始
文本
信息之外,我还可以
使用
这个模块来获取有关字体面板(例如粗体和斜体)或字体大小(例如12对18 12)的信息吗?最接近我所能到达的是,询问如何
使用
这个模块
提取
突出显示的
文本
条目。有没有更直接的方法从
python
中的Word文档中
提取
格式信息?通过快速文档模
浏览 4
提问于2016-06-30
得票数 2
回答已采纳
1
回答
使用
python
从pdfs中
提取
特定
文本
pymupdf
、
pdfplumber
、
grobid
我尝试过不同的
python
库来从pdfs中
提取
特定的
文本
,我必须从这个pdf中
提取
标题下的
文本
,我必须将从例1开始的
文本
提取
为菱形粗体。 下一个pdf包含不同格式的的数据。在这个pdf中,我必须从历史
提取
数据到检查,然后从检查到调查与历史和调查作为一个excel文件中的列和相应的数据
行
。
python
regex不能满足这个条件,因为每种pdf格式都是不同的,我们需要来自不同pdfs的不同类型的
文本
。
浏览 20
提问于2022-06-30
得票数 0
1
回答
打印gdb中当前语句引用的所有变量符号的值,例如,for assert(...)失败
gdb
更好的做法是,在
使用
-ggdb3构建可执行文件时以递归方式包括宏展开 我现在看到的是这样的: #4 0x0000000000xxxxxx in Foo (....)
浏览 11
提问于2020-10-20
得票数 0
回答已采纳
2
回答
从PDF -Tokenize TypeError中
提取
文本
python
、
pdf
、
extract
当我尝试
使用
TypeError从PDF中
提取
文本
时,我得到了一个:“不能在类似字节的对象上
使用
字符串模式”。有谁能帮忙解决这个问题吗?当我打印(
文本
)时,我从我想要
提取
的PDF中获取
文本
,尽管格式有点奇怪。然而,
文本
等只包含数字.?",第1323
行
中,在sentences_from_text返回中[
文本
:e表示s,e在self.span_tokenize(
文本
)中,]文件"
浏览 2
提问于2019-01-22
得票数 1
2
回答
从excel csv文件中读取特定
行
/列
python
、
excel
、
csv
、
export-to-csv
我是
python
的初学者,我希望从.csv电子表格中取三个特定的列,从某一
行
开始,然后将每个列导入
Python
。 任何帮助都将不胜感激。
浏览 12
提问于2015-06-01
得票数 0
1
回答
如何在将文档从PDF转换为
文本
时处理unicode字符编码问题
pdf
、
unicode
、
character-encoding
、
text-processing
、
pdf-conversion
我正在尝试从PDF中
提取
文本
。PDF包含印地语(Unicode)
文本
。我
使用
的
提取
实用程序是Apache PDFBox ( )。
提取
器
提取
文本
,但
文本
无法识别。我尝试了在多种编码和字体之间
切换
,但仍然无法识别预期的
文本
。下面是一个例子:假设PDF中的
文本
是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
1
回答
可以在shell中逐行运行脚本,但完整脚本不返回任何内容。
python
、
shell
我
使用
一个从PDF文件中
提取
文本
的脚本。如果我在shell中一次运行一
行
脚本,它就可以正常工作(即
提取
的
文本
在shell窗口中返回),但是如果我尝试执行整个脚本,则不会返回任何内容。该脚本如下:pdfReader = PyPDF2PdfFileReader(pdfFileObj
浏览 2
提问于2015-10-01
得票数 1
回答已采纳
3
回答
使用
python
pdfminer
提取
整个pdf数据
python
、
pdf-reader
我正在
使用
pdfminer通过
python
从pdf文件中
提取
数据。我想
提取
所有存在于pdf中的数据,无论它是图像还是
文本
或其他什么。我们可以在一
行
(如果需要的话,也可以是两
行
,不需要太多工作)中做到这一点。任何帮助都是非常感谢的。提前感谢
浏览 0
提问于2013-06-09
得票数 4
回答已采纳
1
回答
读取
文本
文件时更改为可识别的编码?
python
、
file
、
python-3.x
、
encoding
当
使用
(例如) UTF-8编码打开
文本
文件进行读取时,是否可以在读取过程中更改编码?在
Python
中,可以以二进制模式读取文件,并自己将bytes类型的
行
转换为str。当在某些
行
中找到有关编码的信息时,只需
切换
将
行
转换为unicod
浏览 0
提问于2016-09-04
得票数 0
2
回答
是否有一种
使用
python
从
文本
文件中只
提取
特定
行
的方法?
python-3.x
我有一个大的
文本
文件,大约有200
行
记录/
行
。 但我只需要
提取
以CLM开头的特定
行
。例如,如果文件有以CLM开头的100 K
行
,我应该单独打印所有的100 K
行
。有人能帮助我
使用
python
脚本来实现这个目标吗?
浏览 1
提问于2021-06-01
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python工具教你提取文本名词短语
如何用Python从PDF文件中提取文本词汇
使用Python自动提取内容摘要
Python提取Word文档中所有超链接地址和文本
多版本 Python 在使用中的灵活切换
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券