我正在寻找最好的(希望) API (但我会解决)工具的建议,将采取PDF和返回相应的HTML。我所说的“最佳”主要是指最合理的结构化形式(例如,当PDF表示中有一个标题时,生成一个HTML“标题”标签),尽管可用性/可访问性也是优先考虑的。理想情况下,我希望纯粹在Java API级别与此交互,而不是Java代码读取另一个可执行文件的stdout。我意识到这不是一个微不足道的问题(http://discerning.com/hacks/docutils/pdf2xml/readme.html),我想知道除了http://discerning.com/hacks/docutils/pdf2xml/readme.html之外,是否有任何真正像样的解决方案。即使在Adobe方面,我也欢迎对MARS或其他解决方案的经验的反馈。
发布于 2011-01-04 02:10:40
查看名为iTextSharp的工具
https://stackoverflow.com/questions/4586949
复制相似问题