我正在尝试使用pdfminer.high_level.extract_text()
将PDF转换为纯文本。我一直收到这个错误消息:
File "/Users/ian/Documents/Resume Selector Project/resumeBackend.py", line 5, in digestResume
text = pdfminer.high_level.extract_text
AttributeError: module 'pdfminer' has no attribute 'high_level'
起初,我认为这可能是我的模块没有在系统范围内安装的问题,但我相信通过在我的项目所在的同一目录中运行pdf2txt.py,我已经消除了这一可能的原因。
我会附上我的代码,以减轻这个问题的解决。
import pdfminer
print(pdfminer.__version__)
res = '~/Documents/Personal/Employment/Resumes/Resume\ 11/03/2020'
def digestResume(resume): #resume is a pdf file (as str)
text = pdfminer.high_level.extract_text(resume)
print(text)
digestResume(res)
发布于 2020-11-24 06:18:15
为了使用pdfminer.high_level
,您需要运行pip3 install pdfminer.six
。然后,为了在代码中使用该包,您需要在import pdfminer
行之后添加import pdfminer.high_level
行。这是因为默认情况下,Python不会自动导入子包。
https://stackoverflow.com/questions/64948893
复制相似问题