Python使用行切换提取文本_python 提取行_python提取行 - 腾讯云开发者社区

python、parsing、line

我使用的是Python3.7，并且有一个如下所示的test.txt文件： <P align="left">      <FONT size="2">Prior</FONT> 我需要提取"be be“(第4行)到"per share”(第7行)之后的所有内容。

浏览 25提问于2019-09-20得票数 1

回答已采纳

1回答

在Python docx中从.docx (Word)文件中读取头

python、openxml、python-docx

我正在使用库解析docx文件。我需要阅读文档的标题以及段落，但是我在他们的文档中找不到任何关于文档标题的内容。有关于将头文件写入新文件的文档，但没有关于读取头文件的文档。有没有办法做到这一点？

浏览 3提问于2015-07-16得票数 2

1回答

JQuery显示从可见的HTML单元格中串联的文本列表

javascript、jquery、html

在每一行的第一个td中，都有一个农民的名字(例如，"farmer1“、"farmer2”等等)。因此，每一行代表不同农民的信息。假设出于某种合理的原因，某些行被隐藏。| 1 farmer4 | 0 | 1 | 0farmer2 farmer3 farmer4我无法理解的部分

浏览 2提问于2015-02-03得票数 0

回答已采纳

4回答

使用Python从语料库中提取句子

python、python-2.7

我正在尝试使用Python从文本中提取句子。文本中的每个单词都写在一行中，并带有与该单词相关的附加信息：loves Verb No-Name.我想要提取包含具有某些特定特征的单词的整个句子(例如，带有名称的句子)。到目前为止，我只提取了感兴趣的单词，而不是整个句子。我使用.readlines()逐行阅读文本。然后，我循环遍历这些行，并

浏览 0提问于2012-10-16得票数 1

11回答

高效地查找文本文件中的最后一行

python、text

我需要从一些非常大(几百兆字节)的文本文件中提取最后一行来获取某些数据。目前，我使用python遍历所有行，直到文件为空，然后处理返回的最后一行，但我确信有一种更有效的方法可以做到这一点。使用python检索文本文件最后一行的最佳方法是什么？

浏览 14提问于2011-08-24得票数 50

1回答

如何提取单元格格式(粗体、斜体、.)从Excel文件中使用Python？

python、excel、format

我试图从Excel文件中提取单元格的内容(本质上是文本)和文本的格式。我正在处理的Excel看起来像下面的截图：单元格中的文本可能是粗体、斜体或笔画，我需要将文本和格式提取为python字符串。例如，如果单元格包含： - line 1 /n- **line 2**/n- *line 3** 以获取

浏览 1提问于2018-07-04得票数 4

1回答

用Python阅读PDF摘要

python

我正在尝试用PDF阅读一些Python文档。它是否存在一个能够这样做的library？

浏览 0提问于2019-02-27得票数 0

1回答

很多用于循环，但PyQT5输出文本

python、pyqt5

我将从Python控制台切换到Python /Programm。我用的for loops有很多指纹。我用输出文本aka切换到PyQT5。date = data['data'][i]["date"] i += 1 我只有一个输出文本，现在我怎样才能只使用一个命令就能得到从for循环中得到的所有

浏览 7提问于2022-07-12得票数 1

回答已采纳

2回答

当使用pipenv时，`tkinter._test()‘按钮是不可见的

python、tkinter、tkinter-macos

我正在MacOSX10.15.1 (Catalina)上运行这段代码"""在看到@ShayneLoyd的回答(建议我需要一个更新版本的Python和更新的Tk版本)之后，我开始寻找更多的，这意味着您可以使用自制的Python安装一个版本，链接自己安装的版本的Tk。一开始，我是这样运行的： $> cd ~/Source&#

浏览 7提问于2019-11-07得票数 4

回答已采纳

3回答

文本提取项目-仅从PDF中提取特定行/项的最佳工具？

python、ruby、pdf、text、automator

我正在做一个项目，它将从pdf文档中提取指定的文本。我没有这种提取的经验。有一个问题是，我们不只是想转储文档中的所有文本。更确切地说，是否有一种方法只提取pdf中的某些字段？我正在尝试使用苹果的自动化-这是能够得到所有的文本，但没有指定的文本。理想情况下，我希望页面中的某个人有30行离散的文本，并将其中的20行指定为“目录项”，并让Automator脚本只使用这20行</e

浏览 2提问于2012-03-25得票数 2

1回答

提取MS Word文档格式元素以及原始文本信息

python、ms-word、python-docx

在 @mikemaccana中，描述了如何使用从python内部的MS文档中提取原始文本数据。我想再走一步。除了简单地提取原始文本信息之外，我还可以使用这个模块来获取有关字体面板(例如粗体和斜体)或字体大小(例如12对18 12)的信息吗？最接近我所能到达的是，询问如何使用这个模块提取突出显示的文本条目。有没有更直接的方法从python中的Word文档中提取格式信息？通过快速文档模

浏览 4提问于2016-06-30得票数 2

回答已采纳

1回答

我尝试过不同的python库来从pdfs中提取特定的文本，我必须从这个pdf中提取标题下的文本，我必须将从例1开始的文本提取为菱形粗体。下一个pdf包含不同格式的的数据。在这个pdf中，我必须从历史提取数据到检查，然后从检查到调查与历史和调查作为一个excel文件中的列和相应的数据行。python regex不能满足这个条件，因为每种pdf格式都是不同的，我们需要来自不同pdfs的不同类型的文本。

浏览 20提问于2022-06-30得票数 0

1回答

打印gdb中当前语句引用的所有变量符号的值，例如，for assert(...)失败

gdb

更好的做法是，在使用-ggdb3构建可执行文件时以递归方式包括宏展开我现在看到的是这样的： #4 0x0000000000xxxxxx in Foo (....)

浏览 11提问于2020-10-20得票数 0

回答已采纳

2回答

从PDF -Tokenize TypeError中提取文本

python、pdf、extract

当我尝试使用TypeError从PDF中提取文本时，我得到了一个：“不能在类似字节的对象上使用字符串模式”。有谁能帮忙解决这个问题吗？当我打印(文本)时，我从我想要提取的PDF中获取文本，尽管格式有点奇怪。然而，文本等只包含数字.？"，第1323行中，在sentences_from_text返回中[文本:e表示s，e在self.span_tokenize(文本)中，]文件"&#x

浏览 2提问于2019-01-22得票数 1

2回答

从excel csv文件中读取特定行/列

python、excel、csv、export-to-csv

我是python的初学者，我希望从.csv电子表格中取三个特定的列，从某一行开始，然后将每个列导入Python。任何帮助都将不胜感激。

浏览 12提问于2015-06-01得票数 0

1回答

如何在将文档从PDF转换为文本时处理unicode字符编码问题

pdf、unicode、character-encoding、text-processing、pdf-conversion

我正在尝试从PDF中提取文本。PDF包含印地语(Unicode)文本。我使用的提取实用程序是Apache PDFBox ( )。提取器提取文本，但文本无法识别。我尝试了在多种编码和字体之间切换，但仍然无法识别预期的文本。下面是一个例子:假设PDF中的文本是:पवार有什么建议吗？

浏览 3提问于2011-09-20得票数 4

回答已采纳

1回答

可以在shell中逐行运行脚本，但完整脚本不返回任何内容。

python、shell

我使用一个从PDF文件中提取文本的脚本。如果我在shell中一次运行一行脚本，它就可以正常工作(即提取的文本在shell窗口中返回)，但是如果我尝试执行整个脚本，则不会返回任何内容。该脚本如下：pdfReader = PyPDF2PdfFileReader(pdfFileObj

浏览 2提问于2015-10-01得票数 1

回答已采纳

3回答

使用python* pdfminer提取整个pdf数据*

python、pdf-reader

我正在使用pdfminer通过python从pdf文件中提取数据。我想提取所有存在于pdf中的数据，无论它是图像还是文本或其他什么。我们可以在一行(如果需要的话，也可以是两行，不需要太多工作)中做到这一点。任何帮助都是非常感谢的。提前感谢

浏览 0提问于2013-06-09得票数 4

回答已采纳

1回答

读取文本文件时更改为可识别的编码？

python、file、python-3.x、encoding

当使用(例如) UTF-8编码打开文本文件进行读取时，是否可以在读取过程中更改编码？在Python中，可以以二进制模式读取文件，并自己将bytes类型的行转换为str。当在某些行中找到有关编码的信息时，只需切换将行转换为unicod

浏览 0提问于2016-09-04得票数 0

2回答

是否有一种使用python从文本文件中只提取特定行的方法？

python-3.x

我有一个大的文本文件，大约有200行记录/行。但我只需要提取以CLM开头的特定行。例如，如果文件有以CLM开头的100 K行，我应该单独打印所有的100 K行。有人能帮助我使用python脚本来实现这个目标吗？

浏览 1提问于2021-06-01得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云