文章/答案/技术大牛

发布

社区首页 >问答首页 >pdfminer3k在PDFPage中没有名为create_pages的方法

问pdfminer3k在PDFPage中没有名为create_pages的方法
EN

Stack Overflow用户

提问于 2014-10-17 04:21:33

回答 2查看 8.8K关注 0票数 6

因为我想从python 2转到3，所以我尝试在python3.4中使用pdfmine.3kr。看起来他们把所有的东西都编辑好了。他们的更改日志没有反映他们所做的更改，但是我没有成功地用pdfminer3k解析pdf。例如：

他们已经将PDFDocument移到了pdfparser中(如果我拼写错误，很抱歉)。PDFPage曾经有过create_pages方法，现在已经没有了。在PDFPage中，我所能看到的只有内部方法。有没有人有pdfminer3k的工作示例？似乎没有新的文档来反映任何变化。

python

pdfminer

回答 2

Stack Overflow用户

发布于 2015-01-02 16:29:14

如果您对从pdf文件中读取文本感兴趣，下面的代码可以使用Python3.4与pdfminer3k一起使用。

from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LAParams, LTTextBox, LTTextLine

fp = open('file.pdf', 'rb')
parser = PDFParser(fp)
doc = PDFDocument()
parser.set_document(doc)
doc.set_parser(parser)
doc.initialize('')
rsrcmgr = PDFResourceManager()
laparams = LAParams()
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
# Process each page contained in the document.
for page in doc.get_pages():
    interpreter.process_page(page)
    layout = device.get_result()
    for lt_obj in layout:
        if isinstance(lt_obj, LTTextBox) or isinstance(lt_obj, LTTextLine):
            print(lt_obj.get_text())

fp.close()

票数 24

Stack Overflow用户

发布于 2017-03-31 09:36:41

也许，您可以使用pdfminer.six。它的描述：

PDFMiner的

分支使用six实现Python 2+3兼容性

使用pip安装后：

pip安装pdfminer.six

它的用法就像pdfminer一样，至少在我的代码中是这样。

希望这能拯救你的一天:)

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/26413216

复制

相似问题

问pdfminer3k在PDFPage中没有名为create_pages的方法
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问pdfminer3k在PDFPage中没有名为create_pages的方法EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问pdfminer3k在PDFPage中没有名为create_pages的方法
EN