我正在从一个WordExtractor类(apachePOI)中提取文本,但是对于一些.doc文件,我遇到了一个错误。调试时,我发现有问题的那行是这里的最后一行:WordExtractorwe = new WordExtractor(docx);
String T = we.getText().replaceAll("\\n&q
在我的项目中,有一个要求是显示Word文档(.doc,.docx)文件中的页数和Excel文档(.xls,.xlsx)中的工作表数量。我尝试使用Docx4j读取.docx文件,但性能非常差,但我只需要字数,并尝试使用ApachePOI。我收到一个错误,类似于:
"trouble writing output: Too many methods: 94086; max is 65536.
我试图使用ApachePOI从Microsoft文档中删除一组连续段落。据我所知,删除一个段落的所有运行都是可能的,方法是: * Deletes the given paragraph.public static void deleteParagraph(就像每个段落都会被转换成一个新的行。
通过从代码中打印段落的内容,我实际上可以看到一个空格(为每个删除的段落)。