我正在使用iText生成PDF,它工作得很好。但我需要一种方法,从一个现有的PDF导入html样式的信息在某个时间点。我知道我可以使用XMLWorker类直接从我自己文档中的html生成文本。因此,使用XSLT从html生成PDF。此PDF的内容应复制到我的文件。书中描述了两种方法("iText in Action")。一个解析PDF<
我试图使用pdfbox从PDF文件中提取文本,但不是作为命令行工具,而是在我的Java应用程序中。我正在下载pdf使用jsoup。= new PDDocument();PDFTextStripper stripper = new PDFTextStripper();
String text = stripper.getText(pdf