在数十亿文档上精确匹配短语似乎是不可能的,搜索引擎是如何做到的呢?
我唯一的猜测是,他们实际上不会进行真正的精确短语匹配。他们有一个单词索引,返回包含特定单词的每个文档,然后他们从“精确短语”中挑选单词,并与单词列表相交。例如,当我在Google上搜索"cut down tree“时,我得到的一个页面是 on Instructables,但在这个页面上找不到确切的短语"cut down tree”。最接近的是“砍倒
我在MySQL表中有大量的VARCHAR条目(约4000万)。字符串的长度可以在5-80个字符之间。The qick brwn foxThs is another sntence因此,经过一些研究,并给出以下的答案,这将不是那么容易,我可能需要研究模糊匹配。考虑到我的数据现在存储在数据库中,对此有什么好的方法吗?编辑1:尝试使
我有一个简单的搜索引擎在我的网站上运行,但每次我搜索一个非常具体的术语,如“6月7日”,它会在数据库中显示与“6月”相关的所有内容。我不知道如何让我的PHP搜索引擎调用数据库中的特定关键字。帮帮忙?isset($first_pos)) $first_pos = "0";$sql_query = mysql_query("SELECT * FROM n