首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >搜索排名/相关性算法

搜索排名/相关性算法
EN

Stack Overflow用户
提问于 2008-10-07 09:29:37
回答 3查看 23.1K关注 0票数 23

在开发知识库中的文章数据库时(例如)-排序和显示用户问题的最相关答案的最佳方法是什么?

您是否会根据以前的用户是否找到帮助文章来使用其他数据,例如关键字权重,或者您是否认为简单的关键字匹配算法就足够了?

EN

回答 3

Stack Overflow用户

发布于 2008-10-07 09:42:41

这是一个很难回答的问题,像谷歌这样的公司正在努力解决这个问题。看看Google Enterprise Search ApplianceExalead Enterprise Search吧。

然后,作为我个人的观点,我不认为任何“朴素”的方法与朴素的关键字搜索和按文档上的浏览量排序相比,都不会有太大的改善。

如果你有可能将你的知识库暴露在网络上,那么就去做吧,让你最喜欢的搜索引擎为你处理搜索。

票数 3
EN

Stack Overflow用户

发布于 2008-12-19 22:11:42

你的确切问题更具体一点会更好。你可以使用很多不同的技术。其中许多都是由其他数据驱动的。当然,您可以使用Lucene并构建自己的索引。lucene有许多语言的绑定。接下来是Solr项目,它包含了很多工具和额外的功能。这可能更符合你正在寻找的东西。

意图是棘手的,大多数现代搜索引擎依赖于统计意图来帮助对结果进行排序。您可以始终使用is this文章有用按钮,并存储指向有用文档的查询文本。然后,您可以向索引中添加一层信息,以增强特定的单词或短语,并帮助它们指向特定的文档。

一些东西,以思考about...How许多文件?平均长度是多少?它们是否经常更新?用户如何处理这些文档?将独特的单词传播到文档是什么样子的?(更简单的是,根据常见的独特特征将查询与特定文档进行匹配是否很容易。)

如果它是在网络上,你总是可以做一个谷歌自定义搜索引擎,只搜索你的网站,尽管你可能会发现由于各种原因,这是次优的。

您总是可以从一个简单的索引开始,然后通过与用户交谈和捕获数据来逐渐使其变得更加复杂。

票数 2
EN

Stack Overflow用户

发布于 2008-10-08 10:36:12

当处理问题时,关键字匹配是不够的,你需要理解意图,正如joannes所说的搜索中的一个非常热门的主题

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/177753

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档