我正在处理一个具有1000行和10个特性的二进制分类问题。
在我使用随机森林进行分类的同时,我也用石灰来解释随机森林的预测。然而,我偶然发现了如下所示
Intercept 0.7932393836062923
Prediction_local [0.71440155]
Right: 0.6854552819361831
石灰根据以下公式计算prediction_local
exp.local_exp = exp.intercept[1] + sum([weight[1] for weight in exp.local_exp[1]])
0.714401551296631 #returned this value (matches with `Prediction_Local`)
所以,我的问题是
( a)当个别特征对预测的贡献很小时,我如何才能说服业务相信巨大的拦截价值?拦截有什么用?如果企业问为什么拦截价值高,我如何解释其背后的理由?
我理解拦截帮助我们捕获所有线性模式(没有拦截的模型无法捕获),但它如何获得它的价值?如果你被要求解释如何使用截取来模拟预测,你会如何向普通的外行解释呢?
( c)在上述石灰解释中,我们可以看到局部预测的主要贡献来自于intercept
。因此,我试图了解它是如何获得其价值的,以及如何解释和翻译它对业务涉众的有用性?我知道当X=0的时候拦截是一个常数。那么,这是什么意思?它有什么用?正如您在上面的例子中所看到的,尽管我的输入变量系数非常低,但由于截获值高,它仍然可以正确地预测类/结果。但是,正如您所知道的,这个截距值不是来自我们的输入变量。那么,我们如何用对业务用户的简单解释来解释这个截取值的推理呢?
这个问题也是因为我在没有数学术语的情况下向业务用户解释拦截时遇到了困难。
发布于 2022-02-13 15:32:32
随机森林二元分类模型中没有截距项。问题中的截取项来自LIME (本地可解释模型-不可知论解释),它使用代理模型。从您的问题中还不清楚您所使用的代理模型是什么,但是让我们假设它的逻辑回归。
拦截意味着当所有功能的值都为零时,正类的可能性有多大。较大的截取值意味着获得正类的机会很大。考虑到LIME只使用本地预测,并且可以做什么-如果建模,您可以为业务提供具体的示例。对于给定的数据点,该模型对正类成员的概率进行了预测。
因为您的原始模型是随机森林,所以显示一个预测路径的可视化可能更有意义(而不是解释一个单独的代理模型)。
https://datascience.stackexchange.com/questions/107928
复制相似问题