我正在使用Indri和TrecEval,我想知道我们是否可以使用F-measure,精度,召回率,以及排名检索结果。
如果是,F度量是什么.将意味着什么?这些值是否有某种相关性,比如评估查询是否接近语料库?
我知道map值是用来评估排名结果的。但我想知道如果F-measure..。可能对其他东西有用。我对此感到困惑,我做了一些研究,但有些东西我不明白。
谢谢你的帮助。
发布于 2018-03-18 19:16:48
Precision、Recall和F1是基于集合的度量。这意味着他们给一组文档打分,而不是排名。
我们通常在固定数量的顶级文档上评估这些类型的度量: 5,10,20,50,100,500,1000。然后我们可以画一条曲线,它以某种方式显示了整个排名。
或者你会在20的时候讨论精度/召回率,例如在大多数界面的前两页结果中。F1并没有太多地用于IR,因为我们的排名衡量标准无论如何都会平衡这些指标(AP、NDCG等)。
F1@20将根据您的排名,给出一个代表最佳10个文档中召回率和精确度的几何平均值的数字。
https://stackoverflow.com/questions/49343347
复制相似问题