虽然通过网上的各种资源来理解shap的情节,我最终还是有点困惑。以下是我对例子中的整体情节的解释-


)--在单个数据点示例中,基值/期望值是整个数据集->中的平均预测,但在总体图中(在顶部引用),我们是说它是没有该特性的平均预测。所以事情就不算了?谢谢你的帮助!)
发布于 2020-03-15 23:56:56
我认为你的解释不完全正确。松散地重新定义朗德伯格等人[arXiv:1802.03888],特性i的SHAP值是
对所有可能的特性子集( S,i \notin S )进行平均。这里,f(x)是输入x模型的预测。预印的图2是一个很好的例子:

我们感兴趣的是特定特征的(符号)箭头长度,在特征的所有排列上平均。对于线性模型y(x) = w^Tx,特征i的SHAP值只是w_i x_i。
现在让我们看看你的物品:
https://datascience.stackexchange.com/questions/65795
复制相似问题