首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

模型评价指标—KS

一、详细介绍KS 1 什么是KS KS(Kolmogorov-Smirnov):好坏样本之间累计分布的差值(最大值),用于评估模型的风险区分能力。...=Series(ksds.index) ks_index=ks_index.quantile(q=qe) ks_index=np.ceil(ks_index).astype(int)...[ksds.ks.idxmax()] print('ks_value is '+ str(np.round(ks_value,4))+' + at pop = '+ str(np.round(ks_pop...得到结果如下: ks_value is 0.354 + at pop = 0.3002 ? ? 三、如何评价KS 我们计算出了模型的KS,那么多少的KS值,模型才是可以使用的?...根据行业内的规范,一般KS值要大于0.2才是一个可用的模型,且KS值越大模型效果越好。 但是,KS值过高,需核验模型是否使用未来变量,要谨慎使用。 具体KS值对应的模型区别能力见下表: ?

6.3K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    风控ML | 风控建模的KS

    我将会从下面几个方面来展开讲解一下KSKS的概念 KS的生成逻辑 KS的效果应用 KS的实现 01 KS的概念 KS的全称叫“Kolmogorov-Smirnov“,我知道的是苏联数学家提出来的一个检验方法...02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在风控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算...具体的可以看下面的Demo: 我们将数据进行可视化,就可以得到经常看到的KS曲线图,并且从表格or曲线图中可以看到这个模型的KS是0.43。...03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行...今天我们就先了解清楚一下KS就可以了。

    4.5K30

    【Python数据挖掘】应用toad包中的KS_bucket函数统计好坏样本率、KS

    本文和你一起探索数据挖掘常用的函数toad.metrics.KS_bucket。...具体语句如下: help(toad.metrics.KS_bucket) 得到结果如下: Help on function KS_bucket in module toad.metrics: KS_bucket...四、应用KS_bucket函数计算变量的KS值 1 等频分割 接着,调用toad库下的KS_bucket函数,设置10等分等频分箱,进行数据统计分析,语句如下: d1=toad.metrics.KS_bucket...ks列统计对应分箱中累计好样本率和累计坏样本率的差值。详细的KS原理可以参考本公众号文章:模型评价指标—KS。...五、循环计算所有变量的KS值 最后,挑选需要统计KS值的变量,先展示全体变量,语句如下: columns = list(date.columns) columns 得到结果: ['input_time'

    1.9K10

    KS检验及其在机器学习中的应用

    KS检验及其在机器学习中的应用 什么是KS检验 Kolmogorov–Smirnov 检验,简称KS检验,是统计学中的一种非参数假设检验,用来检测单样本是否服从某一分布,或者两样本是否服从相同分布。...我们有假设:为此,我们构造KS统计量: 如下图,经验分布函数与目标分布的累积分布函数的最大差值就是我们要求的KS统计量: ?...image.png 两样本的KS检验 用同样的思想,我们可以检验「两个样本是否服从同一分布」,此时KS统计量为两样本的经验分布函数的最大差值 ?...ks_2samp(data1, data2) Ks_2sampResult(statistic=0.9219219219219219, pvalue=0.0) 这里KS统计量甚至超过了0.9,一般来说,...KS统计量超过0.6,就说明模型的分类能力比较强了。

    3.3K20

    理解逻辑回归中的ROC曲线和KS值「建议收藏」

    例如预测明天的温度,23,24,25度) 分类中比较常用的是二分类(label结果为0或1两种) 2.逻辑回归不是回归 从名字来理解逻辑回归.在逻辑回归中,逻辑一词是logistics [lə’dʒɪstɪks...但是最好的阈值是不能通过这个图知道的,要通过KS曲线得出。...KS曲线的纵轴是表示TPR和FPR的值,就是这两个值可以同时在一个纵轴上体现,横轴就是阈值,,然后在两条曲线分隔最开的地方,对应的就是最好的阈值,也是该模型最好的AUC值,就比如是上图的AUC=0.810...KS值就是max(abs(TPR-FPR)),即:TPR和FPR只差最大的那个值。.../zyq11223/article/details/79085711 ROC曲线与KS曲线的理解 https://www.jianshu.com/p/07577d1f9fff 关于模型检验的ROC值和KS

    2.4K20

    开源EEG-脑电采集硬件KS108x

    芯森微电子推出的KS108X心电专用芯片,从信号精度、芯片功耗和封装尺寸上来看具有较好的穿戴心电监测应用前景。该系列芯片包含用于单通道信号采集的KS1081和用于双通道信号采集的KS1082。...从测试来看,KS1081芯片能够在手腕手指心电采集上加上简单50Hz滤波,可以拿到很不错的心电ECG完整波形,包括PQRST波。...KS1091/KS1092是一个集成的单/双通道前端,用于小生物电位监测的信号调理。 每个通道由一个高输入阻抗的缓冲器、一个带通放大器(BP-AMP)和一个低噪声和可编程增益放大器(PGA)组成。...KS1091/ KS1092包含一个专门的带通放大器,具有适合低频生物电位的带宽,以及一个优化的低噪声放大器,具有可通过串行外设接口(SPI)配置的宽范围增益设置。...KS1091/KS1092具有高直流输入阻抗,允许通过消能阻抗隔离设计技能进行生物电位采集的直流耦合输入。 该功能在实际应用中支持干接触电极的信号输入。

    9610

    基于 KubeSphere 玩转 k8s 第二季|openEuler 22.03 安装 KubeSphere 实战入门

    请注意,以下操作无特殊说明时需在所有 openEuler 服务器上执行。本文只选取 Master-0 节点作为演示,并假定其余服务器都已按照相同的方式进行配置和设置。...文件,将规划的服务器 IP 和主机名添加到文件中。...-0 2.3 配置 DNS echo "nameserver 114.114.114.114" > /etc/resolv.conf 2.4 配置服务器时区 配置服务器时区为 Asia/Shanghai...vi /etc/chrony.conf # 删除所有的 pool 配置 pool pool.ntp.org iburst # 增加国内的 ntp 服务器,或是指定其他常用的时间服务器 pool cn.pool.ntp.org...命令执行时输入 yes,以接受服务器的 SSH 指纹,然后在出现提示时输入 root 用户的密码。

    77120
    领券