我在UCI仓库提供的虹膜数据集上使用R工具执行Kmeans聚类。
以下是示例数据集:
SepalLength,SepalWidth,PetalLength,PetalWidth,Species
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa我执行了以下三个命令:
iris<-read.csv("C:/Users/admin/Desktop/Experiment/t2.csv")
View(iris)
km<- kmeans(iris, 3)我得到如下所示的错误:
Error in kmeans(iris, 3) :
more cluster centers than distinct data points.
In addition: Warning message:
In kmeans(iris, 3) : NAs introduced by coercion我想这可能是因为第5列的Species,因为它是非数字的。因此,我从dataset中删除了该列,然后再次重复上面提到的命令。但是,我仍然得到相同的错误。
发布于 2016-04-04 14:39:03
试着用这个
iris<-read.csv("C:/Users/admin/Desktop/Experiment/t2.csv", header=FALSE)
https://stackoverflow.com/questions/22910470
复制相似问题