我在两台机器上使用相同版本的xpdf。然而,在Windows7PC上创建的.txt文件与在Ubuntu12.04Linux服务器上创建的文件不同。Windows7的.txt文件格式良好,有许多换行符,这使得解析相当容易。但是,linux版本根本不包含任何换行符。在linux上运行时,我是否需要显式调用Windows 7上的pdftotext所使用的选项?
发布于 2013-02-03 22:00:49
通过阅读以下http://linux.die.net/man/1/pdftotext手册页,我看到了以下内容:
-eol unix | dos | mac您是否可以尝试使用以下标志执行,并查看这是否解决了问题:
pdftotext -eol dos https://stackoverflow.com/questions/14673233
复制相似问题