我一直在尝试运行apache提供的pdf2text工具。我最初收到“无法加载主类清单属性”错误。因此,我修改了jar中的清单文件,使其包含Main-Class属性。: at java.io.FileInputStream.open<init>(FileInputStream.java:66)
at org.apache.pdfbox</em
我试图使用Apache对二进制文件使用ByteArrayInputStream来解析pdf文件.开始得到一些pdf文件的错误,而对于一些文件来说,它解析得非常好。之前我能够用Tika解析相同的pdf文件,但是现在当我尝试使用ByteArrayInputStream时,我开始得到错误。我认为ByteArray有一些问题--这就是我正在得到的错误。更新:-升级到pdfbox 1.6.0版本后,我开始得到这个错误的一些pdf.@70dbdc4b
at org.apache.pdfbox