我不理解CART (分类和回归树)算法中如何分割连续属性,因为我们知道CART既可以分割分类属性,也可以分割连续属性。
我读了很多论文,它说分割点的值是按顺序的中间值。我不明白这一点。你能给我解释一下这是什么意思吗,并给我举一些例子?
谢谢
发布于 2011-01-30 21:07:00
一般过程是扫描任何给定预测器上的候选拆分值,测量每个拆分的质量,并选择最佳拆分。为了提高效率,扫描可能不会尝试所有可能的分割,而是尝试每个百分位数或其他一些减少的选项集。任何拆分的质量都可以用任意数量的方法来衡量,例如信息增益、二值化等。
如果你正在谈论最初由Breiman,Friedman,Stone Olshen描述的CART算法,那么请查看他们的书“分类和回归树”(1984)。
https://stackoverflow.com/questions/4404410
复制相似问题