dat <- as.data.frame(replicate(100,sample(c(0,1),100,replace=TRUE)))
我想创建一个100x100的矩阵,将这些二进制变量之间的相关系数作为条目如果变量是连续的,那么我就会使用cor()来创建矩阵。我不确定以皮尔逊为方法的cor()是否合理。如果不是,假设我可以找到一个函数fn()来计算一对二
我了解了,CFS使用Pearson correlation来查找数据集之间的强相关性。并探讨了如何利用计算皮尔逊相关系数。根据链接,数据值需要是数值来进行评估。,那么WEKA如何在我的分类数据集上进行评估呢?
奇怪的结果是,在70个属性中,CFS只选择10个属性。是因为分类数据集吗?此外,我的数据集是一个高度不平衡的数据集,其中不平衡的比率为1:9(是:否)。between two