首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何使用pdfminer.six

如何使用pdfminer.six
EN

Stack Overflow用户
提问于 2018-02-08 16:37:16
回答 2查看 14.6K关注 0票数 1

我正在尝试使用Python3.x中的pdfminer从pdf中提取文本。我使用以下命令安装了它

代码语言:javascript
复制
pip3 install pdfminer.six

当我尝试使用下面的命令提取文本时,我得到了一个错误

代码语言:javascript
复制
pdf2txt.py sample.pdf

错误: pdf2txt.py:找不到命令

我已经阅读了官方文档,它们显示了我上面遵循的相同步骤,但仍然不起作用。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-02-08 18:15:42

official documentation假定.py脚本可以自动运行。

要从命令行手动启动PDFminer,请使用启动Python脚本的常规方法:

代码语言:javascript
复制
python pdf2txt.py sample.pdf

然后它将运行该脚本,并在运行完成后退出回命令行。如果您在某处遇到错误或出于某种原因希望继续使用Python,则可以使用

代码语言:javascript
复制
python -i pdf2txt.py sample.pdf
票数 4
EN

Stack Overflow用户

发布于 2019-07-18 13:53:30

虽然已经很晚了,但如果对你有帮助,可以在终端中执行以下操作:

  1. 在终端中键入ls,它将返回文件列表。检查pdf2text.py是否出现在该列表中,sample.pdf也应该出现在该列表中。

  1. 如果这两个文件未显示在列表中,则表示您在不同的目录中,因此您必须导航到这两个文件都存在的适当目录,否则您必须提供文件的名称及其路径。

  1. 进入正确的目录后,只需发出以下命令:

python pdf2text.py sample.pdf

如果参数解析器不需要标识符,它应该可以工作。

或者,提供每个文件的完整路径:

..。当然,将/home/you/downloads/something替换为包含这些文件的实际路径。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48681003

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档