我希望建立一个房地产搜索引擎规格是Approx 500,000上市每日更新潜在5万份上市数据提供的清洁(Ish)CSV的-需要删除字符,编码utf,通常。50+数据字段(30幅图像、各种属性规格等)
我和Drupal7有很多问题,Joomla无法处理。这只是数据的导入。
我想让solr索引数据并充当搜索引擎。我有几个问题。
由于数据困难,我似乎可以简单地解决许多复杂的问题,试图找出D7/Joomla/任何其他cms的内部工作方式,并将几个简单的php文件作为前端。
我不需要任何花哨的外观,是要使用这个项目的基本drupal模板。
我需要速度和可靠性以及优秀的搜索结果。
发布于 2012-04-06 23:44:51
IMHO应该可以将SOLR完全用于您的目的。即使对于单个服务器,50000个列表的数量也不是很大,但我建议每10h更新500000次确实很多。因为您将有大约每小时50000次更新,这相当于每小时完整的重新索引。
我们也为我们的企业使用SOLR,大约有40-120个字段.40000项确实需要大约5分钟才能完成索引。如果你想自动启动缓存,你必须增加一些时间。
据我所见,您的问题将是很小的更新周期。如果要更新单个文档,而不是每小时更新一次所有50000份清单,则solr不能使用缓存,否则必须使用多个solr服务器。(对于solr 4.0,您甚至可以考虑扩展solr服务器硬件,但我怀疑3.x会有任何好处)缓存的使用不会导致搜索性能下降,但它不必这样做。
由于SOLR提供了您的动态场功能,所以您可以在每个文档中添加不同的结构。这应该符合您的各种属性要求。
https://stackoverflow.com/questions/10052453
复制