我对分布式系统很陌生。我知道solrcloud提供分布式搜索功能。据我所知,hadoop是一个大数据的分布式处理框架。那么,为什么我们要将两个分布式框架集成在一起呢?它是用于hdfs格式的文件索引和搜索吗?在solrcloud中使用hadoop有哪些优点?如果有人能详细解释或给我链接,以更好地理解两者,这将是真正有帮助的。
发布于 2016-06-09 09:45:33
Solr (主要)用于存储和搜索,Hadoop (主要)用于分布式处理。他们解决了不同的问题。
最常见的是使用Solr与HDFS一起存储/加载其索引文件,要么使用HDFS集群中的现有功能,要么允许通过Solr搜索处理Hadoop结果。
如果你在谷歌上做一些搜索,你会发现很多可用的用例、演示文稿和库,比如LucidWorks‘Hadoop积分、Solr+Hadoop或Apache中Hortonworks的索引和搜索数据。
https://stackoverflow.com/questions/37717255
复制相似问题