首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何修复'cannot import name 'process_pdf‘from’pdfmin.pdfinterp‘’错误

如何修复'cannot import name 'process_pdf‘from’pdfmin.pdfinterp‘’错误
EN

Stack Overflow用户
提问于 2019-07-17 23:48:29
回答 1查看 4.3K关注 0票数 2

我正在尝试将pdf文件中的文本转换为文本或HTML格式,但此错误经常出现'cannot import name 'process_pdf‘from 'pdfminer.pdfinterp’‘我如何删除此错误?

我已经在visual basic studio中尝试过这段代码,但它仍然不起作用,但在这种情况下,由于空格导致了缩进错误,所以我在jupyter笔记本中尝试了一下,得到了这个错误。

代码语言:javascript
复制
from io import StringIO
from pdfminer.pdfinterp import PDFResourceManager , process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layput import LAParams



def to_txt(pdf_path):
    input_ = file(pdf_path , 'rb')
    output = StringIO()

    manager = PDFResourceManager()
    converter = TextConverter(manager, output, laparams = LAParams())
    process_pdf(manager, converter, input_)

    return output.getvalue()

b = to_txt(rb"C:\Users\Jasvinder Singh\Desktop\HACK-IN REPORT.docx")

ImportError: cannot import name 'process_pdf' from 'pdfminer.pdfinterp' (C:\Users\Jasvinder Singh\Anaconda3\lib\site-packages\pdfminer\pdfinterp.py)
EN

回答 1

Stack Overflow用户

发布于 2019-07-18 00:29:37

请参阅documentationthis comment on a bug

PDFPage.get_pages()已经取代了process_pdf方法。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57079815

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档