我试图将pdf文档(包括表格)转换为csv文件。不幸的是我失败了。我使用了以下方法:
pdfminer首先将pdf转换成文本,但文本文件的结构与pdf文件的结构不一样。pypdf2首先将pdf转换成文本,但文本文件的结构与pdf文件的结构不一样。pdftotext首先将pdf转换成文本,但文本文件的结构与pdf文件的结构不一样。slate首先将pdf转换成文本,但文本文件的结构与pdf文件的结构不一样。请告诉我适当的方式转换pdf到csv文件。有些人建议我将文档解析为xml文件,然后解析为csv文件。即使如此,我也没有找到解决办法。
PDF文件如下:

是否有更好的工具可以将pdf文档(包括复杂表)转换为csv文件?
最好是使用Python语言的解决方案。
发布于 2017-03-31 22:00:13
可能值得一试,他们有一个用于PDF转换的Python /API,您可以获得免费的页面来试用它。
https://stackoverflow.com/questions/43135343
复制相似问题