我访问了本教程,并得到了使用投票合并多个算法的想法,但我不清楚它是如何工作的实际机制。我想知道,如果第一种算法首先应用于数据集,然后第二种算法被应用到我们从应用的第一种算法得到的分类器上?
假设我选择了朴素的Bayes和Bayes网,那么发生了什么?朴素贝叶斯是先应用于给定的数据集,然后得到分类器C1,next Bayes网应用于C1,最后给出最终分类器为C*,还是每一步算法都起作用,投票结果越高?
发布于 2014-09-25 03:39:02
每个集合成员(或算法)都是根据自己的训练数据进行训练的。一旦对其中的每一个进行了培训,就会使用特定的投票算法对它们进行评估。
通常,当给出估计的测试用例时,每一种算法都会生成它们的估计,然后投票算法决定如何应用分类器的权值,并将最佳输出分配给集成估计。
这并不是说它总是这样工作。我在过去使用过一个被提议的模型,根据问题空间中测试用例的位置选择算法子集,并对每个成员的投票进行不同的加权。每个投票算法都以不同的方式工作,Weka有几个可以尝试的通用模型。
https://stackoverflow.com/questions/26019294
复制相似问题