条件购物车中的“权重”和“权重”是什么?
我正在使用购物车通过递归分区来分析一个小数据集(N=70)。具体地说,ctree函数形成了R中的party包。
我对什么是“权重”和“权重”有点困惑。据我所知,他们将每个节点中的最终观察值称为“权重”。但是,也可以将“权重”设置为使用条件树的模型中的重要性度量,我称之为“统计权重”。
我将一个分类变量设置为“统计权重”,我不确定软件在后面做了什么,但是每个节点的样本大小(N=“权重”)突然比初始节点大5.5倍(N=400),并且总样本大小(N =n1+n2+n3..)取决于最小存储桶和最大深度。我认为模型只会考虑这些变量的可重复性,并在模型中对其进行权衡。我理解节点在样本大小中变化的原因,但我并不期望总N是可变的。
我已经读过patry手册很多次了,也尝试过partykit包。我读了又读,这些概念可能会被解释,但我对在推理树中添加“统计权重”时获得如此大的样本量(“权重”)感到困惑。
发布于 2021-04-27 21:35:10
https://stackoverflow.com/questions/67270941
复制相似问题