当我们计算出特征的IV值后,该如何去解释它的预测能力。
或者说,当IV值取到多大时,我们才选择这个特征。...”target”为目标列,
”iv_only”决定是否只输出iv值。
注意:1. 对于数据量大或高维度数据,建议使用iv_only=True 2....(to_drop,axis=1),'target',iv_only=True)[:15]
3 如何使用toad高效分箱并进行特征筛选
toad.selection.select(dataframe,...(4)return_drop=False: 若为True,function将返回被删去的变量列
(5)exclude=None: 明确不被删去的列名,输入为list格式
如下面的cell,没有变量由于缺失值高被删除...False时输出0,1,2…(离散变量根据占比高低排序),True输出(-inf, 0], (0,10], (10, inf)。