toad持续更新优化中,本教程针对toad的各类主要功能进行介绍,
包括:
EDA相关功能
如何使用toad高效分箱并进行特征筛选
WOE转化
逐步回归特征筛选
模型检验和评判
标准评分卡转化和输出...当我们计算出特征的IV值后,该如何去解释它的预测能力。
或者说,当IV值取到多大时,我们才选择这个特征。...4.2 决策树分箱
数据处理实战: Chimerge和决策树分箱
不同于Chimerge的自下而上, 决策树是自顶向下划分的, 但两者都是监督式分箱方法, 即都需要使用到标签变量。...由于分箱时使用了类信息, 因此区间的边界更有可能定义在有帮助于提高分类准确率的地方。
4.3 toad调用函数
toad的分箱功能支持数值型数据和离散型分箱,默认分箱方法使用 卡方分箱。...False时输出0,1,2…(离散变量根据占比高低排序),True输出(-inf, 0], (0,10], (10, inf)。