我正在一个流行的交友网站上做一个研究项目,名为:OkCupid
我想谈谈数据库是如何使用的。
在阅读了该网站联合创始人的解释后,我感到非常困惑。
发言:
当用户在OkCupid上执行匹配搜索时,我们必须执行以下操作:-Retrieve (来自非DB)他们的问题答案,他们理想的匹配答案,以及他们的问题的重要性。平均而言,OkCupid上的每个用户有3个部分回答了250个问题。 -Figure out有资格进行搜索,这通常是一个涉及数百万用户的非常复杂的查询。平均而言,数以万计的人有资格,我们需要找出他们是谁,而不触及数据库。
他们是如何在不查阅数据库的情况下完成这些工作的?
我完全糊涂了。
这是到帖子的链接
我很感激你对他们在那里做事的解释。
发布于 2012-02-05 02:29:35
他们没有明确提到这一点,所以我在这里只是猜测,但是他们使用一些搜索索引,比如Lucene来执行实际的搜索。它们将拥有某种类型的持久数据库,但它们的搜索索引是根据该数据集定期生成的。
https://dba.stackexchange.com/questions/12267
复制相似问题