我正在尝试对具有14个特征的数据集运行聚类算法。在这些特征中,除了一个,每个特征都在0到1之间。剩下的一个特征是0到8000之间的连续变量。在集群之前,我需要在所有功能上使用标准缩放器,还是只使用这一个功能(0- 8000)??或者我只为这一个功能使用最小-最大定标器??
发布于 2019-02-02 02:54:48
你也不需要“必须”使用它。
标准缩放和0;1缩放(这是不同的)只是加权变量的两种流行的启发式方法。“正确”也不是。
如果你有更好的理由对变量进行不同的加权,你也可以这样做。伸缩并不能让事情变得更“正确”。
减少8000个变量的权重可能是个好主意。但如果出现这个问题,可能意味着你还没有理解你试图解决的问题……你只是在使用一个巨大的,没有计划的。
https://stackoverflow.com/questions/54479965
复制相似问题