首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >使用ElasticSearch和/或Solr作为MS Office和PDF文档的数据存储

使用ElasticSearch和/或Solr作为MS Office和PDF文档的数据存储
EN

Stack Overflow用户
提问于 2015-01-16 13:41:17
回答 2查看 24.3K关注 0票数 22

我目前正在设计一个全文搜索系统,其中用户对MS Office和PDF文档执行文本查询,结果将返回最匹配查询的文档列表。然后,用户将选择返回的任何文档,并在MS Word、Excel或PDF查看器中查看该文档。

是否可以使用ElasticSearch或Solr导入原始二进制文档(即.docx、.xlsx、.pdf文件)导入到其“数据存储”中,然后根据命令将文档导出到用户的设备中进行查看。

以前,我使用MongoDB 2.6.6将原始文件导入到GridFS中,并将提取的文本导入到一个单独的集合(该集合包含一个文本索引),这样做效果很好。但是,MongoDB全文搜索是非常基础的,因此我现在考虑使用Solr或ElasticSearch来执行更复杂的文本搜索。

尼克

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27977939

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档