因此,我有一个包含2304个数值属性和类属性的大型数据集),我希望执行特性选择以删除误导和冗余的属性。这是因为我将运行离散化,以使他们的名义,然后运行Na ves Bayes的数据集。但是,在Weka中的select属性选项卡中,它只按排名顺序列出它们。我知道预处理选项卡中有一个删除筛选器,但是它只接受一个属性的</em
在过去的一个月左右,我一直在自学Weka API (我是一名学生)。我正在做的是写一个程序,它将过滤一组特定的数据,并最终为它构建一个贝叶斯网络,一周前,我已经完成了我的离散化类和属性选择类。就在几天前,我意识到我需要将我的离散化函数更改为supervised,并最终使用了默认的Fayyad &伊朗方法,在我这样做之后,我开始在我的属性选择类中得到这个错误:
Excepti
我试着使用Weka的NaiveBayesUpdateable分类器。我的数据包含名义和数字属性: @attribute country {FR, UK, ...}基于其他属性。
我知道我不能在Weka中使用数值型属性进行贝叶斯分类。一种技术是将数值属性值划分为长度为k的N个区间,并使用标称属性,其中n是类名,如@ attribute class {1,2,3,...N}。然而,我
我试着使用Weka的NaiveBayesUpdateable分类器。我的数据包含名义和数字属性: @attribute country {FR, UK, ...}基于其他属性。
我知道我不能在Weka中使用数值型属性进行贝叶斯分类。一种技术是将数值属性值划分为长度为k的N个区间,并使用标称属性,其中n是类名,如@ attribute class {1,2,3,...N}。然而,我
我在Weka做了一些属性选择(信息增益)。然后,由于每个属性在信息获取方法中的重要性,用新的属性排列返回新的数据。我希望删除一个或多个新数据列,以便在我的数据集中只具有信息属性。在这里你可以看到我的代码:
Instances data = new Instances(new BufferedReader(new FileReader("iris.arff"