我第一次尝试用Lucene.Net当im在内容和/或标题中搜索时,所有操作都很好。索引和搜索使用WhitespaceAnalyzer。使用StandardAnalyzer,当我搜索"/kontakt/index.aspx“时,结果为零。analyzer = new WhitespaceAnalyzer();
MultiFieldQueryParser
基本上,我索引了85k html文件(google结果页面和关键词是不同的大学名称),我在lucene索引中使用每个页面的标题作为一个名为" title“的字段。然而,当我将关键字改为"duquesne"时,我可以用标题得到一个结果:“标题:Duquesne Google ”--为什么会发生这种情况?从第二次尝试,我可以看出这个文件的标题是杜克纳Univeristy索引,但我不能从第一次尝试。许多Thx!
我知道如何在索引时或查询时提升字段。但是,我如何才能提高匹配离标题开头更近的术语的分数?示例:Doc2 title = "I have a question about lucene?"我希望第一个文档得分更高,因为"lucene“更接近开头(现在忽略术语freq )。
我了解了如何使用SpanQuery来指定术语之间