有没有人知道一个PDF文件解析器,我可以用它来从纯文本pdf文件中提取部分文本?具体地说,我希望有一种方法能够可靠地拉出特定于注释的文本部分。
Delphi,C# RegEx我不介意。
发布于 2009-02-09 21:48:55
关于xactpro的PDF File Parser文章似乎正是您所需要的。它解释了PDF的格式,并附带了解析器的完整源代码(以及用于模型可视化的另一个项目)。
解析器使用特定于格式的术语,但您可以很容易地使用可视化工具来了解要查找的内容。
发布于 2009-02-10 07:29:46
你也可以看看Xpdf (http://www.foolabs.com/xpdf/download.html)
发布于 2009-02-09 21:34:37
不确定它是否支持您需要的功能,但我们已经成功地使用了abcPDF。
https://stackoverflow.com/questions/530052
复制相似问题