如何使用pdfminer.six?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (1222)

我尝试在python 3.x中使用pdfminer从pdf中提取文本。我使用以下命令安装它

pip3 install pdfminer.six

当我试图使用下面的命令提取文本时,我会得到一个错误

pdf2txt.py sample.pdf

Error: pdf2txt.py: command not found

我阅读了官方文档,他们显示的是与我上面所遵循的步骤相同的步骤,但我的仍无法正常工作。

提问于
用户回答回答于

官方文档(https://github.com/pdfminer/pdfminer.six)假设.py脚本可以自动运行。但对于所有操作系统而言并非如此(可能是你的本地系统不需要设置使其工作)。

要从命令行手动启动PDFminer,请使用启动Python脚本的常规方法:

python pdf2txt.py sample.pdf

完成后,它将运行脚本并退出到命令行。如果你在某个地方发现错误或出于某种原因想留在Python中,你可以用:

python -i pdf2txt.py sample.pdf
用户回答回答于

斯坦福大学的教程(http://stanford.edu/~mgorkove/cgi-bin/rpython_tutorials/Using%20Python%20to%20Convert%20PDFs%20to%20Text%20Files.php)

扫码关注云+社区

领取腾讯云代金券