在开发知识库中的文章数据库时(例如)-排序和显示用户问题的最相关答案的最佳方法是什么?
您是否会根据以前的用户是否找到帮助文章来使用其他数据,例如关键字权重,或者您是否认为简单的关键字匹配算法就足够了?
发布于 2008-10-07 09:42:41
这是一个很难回答的问题,像谷歌这样的公司正在努力解决这个问题。看看Google Enterprise Search Appliance或Exalead Enterprise Search吧。
然后,作为我个人的观点,我不认为任何“朴素”的方法与朴素的关键字搜索和按文档上的浏览量排序相比,都不会有太大的改善。
如果你有可能将你的知识库暴露在网络上,那么就去做吧,让你最喜欢的搜索引擎为你处理搜索。
发布于 2008-12-19 22:11:42
你的确切问题更具体一点会更好。你可以使用很多不同的技术。其中许多都是由其他数据驱动的。当然,您可以使用Lucene并构建自己的索引。lucene有许多语言的绑定。接下来是Solr项目,它包含了很多工具和额外的功能。这可能更符合你正在寻找的东西。
意图是棘手的,大多数现代搜索引擎依赖于统计意图来帮助对结果进行排序。您可以始终使用is this文章有用按钮,并存储指向有用文档的查询文本。然后,您可以向索引中添加一层信息,以增强特定的单词或短语,并帮助它们指向特定的文档。
一些东西,以思考about...How许多文件?平均长度是多少?它们是否经常更新?用户如何处理这些文档?将独特的单词传播到文档是什么样子的?(更简单的是,根据常见的独特特征将查询与特定文档进行匹配是否很容易。)
如果它是在网络上,你总是可以做一个谷歌自定义搜索引擎,只搜索你的网站,尽管你可能会发现由于各种原因,这是次优的。
您总是可以从一个简单的索引开始,然后通过与用户交谈和捕获数据来逐渐使其变得更加复杂。
发布于 2008-10-08 10:36:12
当处理问题时,关键字匹配是不够的,你需要理解意图,正如joannes所说的搜索中的一个非常热门的主题
https://stackoverflow.com/questions/177753
复制相似问题