我有一个有15万篇新闻文章的新闻网站。每天大约有250篇新文章以5-15分钟的间隔添加到数据库中。我知道Solr针对数百万条记录进行了优化,我的15万对它来说不是问题。但我担心频繁的更新将是一个问题,因为缓存在每次更新时都会失效。在我的开发服务器中,页面的冷加载需要5-7秒来加载(因为每个页面都会运行几个MLT查询)。
如果我把我的索引一分为二--一个归档索引和一个最新索引--会有帮助吗?存档索引将每天更新一次。
有没有人能推荐一些方法来优化我的安装,让我的索引不断更新?
谢谢
发布于 2010-07-14 00:13:30
我的回答是:测试它!如果你不知道它是如何运行的,请不要试图优化。就像你说的,150K并不是很多,它应该很快就能为你的测试构建一个这样大小的索引。之后,在索引更多文档时,从不同的并发线程运行两个MLT查询(模拟用户),以查看它的行为。
您应该关注的一个设置是自动提交。因为您经常索引,所以您不能在每个文档上都提交(您将使Solr关闭)。您将为此设置选择的值将允许您调整系统的延迟(返回新文档到结果中所需的次数),同时保持系统的响应。
发布于 2010-07-16 11:20:24
考虑在主查询中使用mlt=true,而不是发出针对每个结果的MoreLikeThis查询。您将节省往返时间,因此速度会更快。
https://stackoverflow.com/questions/3219984
复制相似问题