问簇的SD (k-means)
EN

Stack Overflow用户

提问于 2019-02-20 02:14:30

回答 1查看 1.6K关注 0票数 1

我正在尝试找出如何让我的聚类的SD获得我的k-means聚类分析。我做了k-means，并得到了几个输出，其中一个是我认为是均值的“中心”。我需要所有这些中心的标准差来显示我的数据，我不知道如何获得它们？

#kmeans
resultspoorT0t <- kmeans(poor_T0v, 3)
resultspoorT0t[["centers"]]

       ALH      BCF      LIN       VAP       VCL      VSL
1 5.130483 12.66909 40.14618  69.78680 146.97313 55.51221
2 3.098673 10.11618 34.38605  29.20927  69.74657 22.70321
3 7.212529 12.98836 41.71680 111.67745 229.73901 92.12502

我尝试了简单的sd()函数，但这只是一个SD，我需要每个集群的每个参数都有SD

#SD
sd(resultspoorT0t$cluster, na.rm = FALSE)
[1] 0.758434

cluster-computing

k-means

standard-deviation

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-02-20 02:45:20

让我们假设你想要一个简单的圆形SD。所以你需要计算每个点从一个集群到该集群中心的距离。它是一个欧几里得距离sqrt(sum((x_mean - x) ** 2+ (y_mean - y) ** 2...))。然后，您可以只计算每个集群的距离SD。代码是：

# Some fake data
set.seed(2222)
df <- matrix(rnorm(6 * 50), 50)
colnames(df) <- letters[1:6]
df <- as.data.frame(df)
k_res <- kmeans(df, 3)

# SD = sd of points distances from cluster center
clusters <- k_res$cluster
centers <- k_res$centers


res_sd <- NULL
for (cl in c(unique(clusters))){
    df_part <- df[clusters == cl, ]

    # Calculate Euclidian distance between 
    # each point (row) and cluster center.
    dist <- sqrt(rowSums((df_part - centers[cl, ]) ** 2))

    # Calculate SD for each column (i.e. SD along each axis)
    sd_s <- apply(df_part - centers[cl, ], 2, sd)
    names(sd_s) <- paste("sd_", colnames(df_part), sep = "")

    res_part <- c(cluster = cl, total_sd = sd(dist), sd_s)
    res_sd <- rbind(res_sd, res_part)
}

res_sd <- as.data.frame(res_sd)
rownames(res_sd) <- res_sd$cluster

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54772543

复制

相似问题

问簇的SD (k-means)
EN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问簇的SD (k-means)EN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问簇的SD (k-means)
EN