我正在使用kNN算法进行分类。在weka中,它们为kNN提供了各种参数设置。我很高兴知道distanceWeighting,meanSquared。
在distanceWeighting中,我们有三个值(无距离加权,权重按1/距离,权重按1-距离)。这些价值观是什么?它们的影响是什么?
有人能把我驱逐出去吗?)
发布于 2015-11-23 11:45:10
如果使用“无距离加权”,则数据点的预测值是所有k邻居的平均值。例如
# if values_of_3_neigbors = 4, 5, 6
# then predicted_value = (4+5+6)/3 = 5
对于1/距离加权,每个邻居的权重与距离成反比。这个想法是:邻居越近,它对预测值的影响就越大。例如
# distance_to_3_neigbors = 1,3,5
# weights_of_neighbors = 1/1, 1/3, 1/5 # sum = 1 + 0.33 + 0.2 = 1.53
# normalized_weights_of_neighbors = 1/1.53, 0.33/1.53, 0.2/1.53 = 0.654, 0.216, 0.131
# then predicted_values = 4*0.654 + 5*0.216 + 6*0.131 = 4.48
对于一段距离,它是相似的。这只适用于所有的距离在0,1范围内。
希望这能有所帮助
https://stackoverflow.com/questions/33873670
复制