R-问题:找到显示一定范围的数据点的非均匀柱状图的最佳数量。
我有一堆数据点(假设不同手机的价格不同)。我需要把这些手机分成几类(根据价格)。仓位大小(在本例中指的是价格范围)不需要统一(在低价类别中可能有很多移动电话,而在长尾类别中可能很少)。
是否有任何有效的算法来找到所需的最优箱数和应该进入每个类别的数据点(在这种情况下是移动电话)的数量。
发布于 2013-05-21 01:58:03
这不是一个标准公式,但我想发布一下,因为它似乎在我测试的数据集上工作得很好。
例如:5部手机,价格为10,20,40,80,200
Avg is 350/5 = 70
这表明,在较高的价格范围内,每1个垃圾桶中有2个垃圾桶会更好。
1箱70以上:范围71 - 200(2个手机)
如您所见,回收站的数量和回收站的大小是合理优化的。
https://stackoverflow.com/questions/16648379
复制相似问题