我目前正在基于下面的实现对Lucene标准的修改。实际公式的实现是直截了当的,但我正在努力计算所需的统计数字。我需要以下两项统计数字:
文档的平均术语频率():length of document / # unique terms of the document (即文档重复度的指示符--对于没有重复的文档,这个值
Kusto允许我创建汇总统计数据,这些统计数据根据表中按某种规则排序的行的顶部,对某些列进行切片。例如,如果我想使用最后100行计算每个位置的平均得分,我可以这样写 T | top 100 by Time | summarize avg(Score) by Location 但我想让top应用于总结的每个例如,我</em