我想知道是否有可能使用OpenGrok来索引PPT、XLS、DOC等格式。这是否必须由我自己编程,或者已经有了这样做的插件/方法?
发布于 2021-05-14 16:19:53
目前还没有专门的分析器来从这些类型的文档中提取数据,但是应该可以基于Read Microsoft Word Documents into Plain Text (DOC, DOCX) in Java中列出的Java库(例如Apache POI或Apache Tika)实现一个分析器。
请随时在https://github.com/oracle/opengrok/issues上提交新的问题
https://stackoverflow.com/questions/27420520
复制相似问题