小弟刚入门,求助一个模型的聚类算法,非常感谢!
我有一个包含30个元素的数据集,每个元素由多个数字组成,这些数字代表该元素的特征。
数据集如下:[[ 0. 0. 1. 1. 5. 1. 0. 0. 0. 1.] [ -1. 0. -1. 0. -2. 0. 1. 0. 2. 0.] [ 1. 1. -1. 0. -2. 2. -1. 2. 6. 0.] [ -1. 0. 3. 3. 6. 1. -6. 1. -2. 6.] [ -4. 1. -3. 1. -1. -1. -1. 1. -2. 0.] [ -2. 2. -3. 2. -1. -2. -1. 0. -3. 0.] [ 4. -3. 1. -3. 4. -4. -2. -7. 2. 7.] [ -4. 2. -1. -1. -1. -1. -1. 1. -2. 0.] [ -3. 1. -1. 0. -1. -2. -2. 1. -2. 0.] [ -1. 0. -1. 1. -2. 0. 0. 1. 1. 0.] [ -2. 0. 2. 0. 1. 2. 0. -2. 0. 1.] [ 1. 1. -1. 0. -2. 3. 0. 2. 4. 0.] [ -1. 0. 0. 0. -1. 0. 0. -1. 0. 1.] [ 0. -1. 2. 2. 2. 0. -3. 1. 4. 2.] [ 2. -4. 2. -2. -1. -2. -3. -6. 4. 9.] [ 1. -2. 4. -5. 3. -3. 0. -8. 3. 9.] [ -1. 2. -2. 3. -1. -4. -1. 1. -2. 1.] [ -3. -1. 4. 0. 9. 1. -4. 0. -3. 6.] [ 2. 1. -1. 0. -2. 2. -1. 2. 5. 0.] [ -1. 0. 0. 0. -1. 0. 0. -1. 0. 1.] [ -2. 1. 0. 0. 0. 0. -1. 0. 0. 1.] [ -1. 0. 1. 1. 5. 0. 0. 0. -1. 1.] [ -4. 1. -3. -1. -1. -1. -1. 1. -2. 0.] [ -1. 0. -1. 1. -2. 0. 1. 0. 2. 1.] [-15. -5. 3. -17. -17. 1. -4. -10. 2. 11.] [ -2. -8. -3. -11. -12. -4. -2. -6. 7. -2.] [ 2. -9. -1. 5. 9. -11. 9. 6. 6. 9.] [ -8. 2. -9. 7. -3. -3. -1. -2. -11. -4.] [ -6. -3. -12. 10. -3. -4. -2. -6. -14. -5.] [ 2. -2. 2. 2. -2. -1. -3. 1. 4. 0.]]
之前用过kmean,但是问题是我也不知道这些数据应该被分为几类,在这种情况下如何对这些元素进行层次聚类?如果使用kmean聚类算法,n_cluster的值如何确定?除了kmean还有其他替代算法吗?
我的最终目的是希望知道哪些元素之间的关系更紧密,特别是当数据集很大的时候。
预期得到的聚类效果大致如下:
因为数据一直是在python里面做的,希望各位大佬指点如何利用python里的包解决这一问题。
再次感谢!
相似问题