首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

模型评价指标—KS

一、详细介绍KS 1 什么是KS KS(Kolmogorov-Smirnov):好坏样本之间累计分布的差值(最大值),用于评估模型的风险区分能力。...=Series(ksds.index) ks_index=ks_index.quantile(q=qe) ks_index=np.ceil(ks_index).astype(int)...[ksds.ks.idxmax()] print('ks_value is '+ str(np.round(ks_value,4))+' + at pop = '+ str(np.round(ks_pop...得到结果如下: ks_value is 0.354 + at pop = 0.3002 ? ? 三、如何评价KS 我们计算出了模型的KS,那么多少的KS值,模型才是可以使用的?...根据行业内的规范,一般KS值要大于0.2才是一个可用的模型,且KS值越大模型效果越好。 但是,KS值过高,需核验模型是否使用未来变量,要谨慎使用。 具体KS值对应的模型区别能力见下表: ?

4.6K20
您找到你想要的搜索结果了吗?
是的
没有找到

风控ML | 风控建模的KS

我将会从下面几个方面来展开讲解一下KSKS的概念 KS的生成逻辑 KS的效果应用 KS的实现 01 KS的概念 KS的全称叫“Kolmogorov-Smirnov“,我知道的是苏联数学家提出来的一个检验方法...02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在风控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算...具体的可以看下面的Demo: 我们将数据进行可视化,就可以得到经常看到的KS曲线图,并且从表格or曲线图中可以看到这个模型的KS是0.43。...03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行...今天我们就先了解清楚一下KS就可以了。

4.2K30

【Python数据挖掘】应用toad包中的KS_bucket函数统计好坏样本率、KS

本文和你一起探索数据挖掘常用的函数toad.metrics.KS_bucket。...具体语句如下: help(toad.metrics.KS_bucket) 得到结果如下: Help on function KS_bucket in module toad.metrics: KS_bucket...四、应用KS_bucket函数计算变量的KS值 1 等频分割 接着,调用toad库下的KS_bucket函数,设置10等分等频分箱,进行数据统计分析,语句如下: d1=toad.metrics.KS_bucket...ks列统计对应分箱中累计好样本率和累计坏样本率的差值。详细的KS原理可以参考本公众号文章:模型评价指标—KS。...五、循环计算所有变量的KS值 最后,挑选需要统计KS值的变量,先展示全体变量,语句如下: columns = list(date.columns) columns 得到结果: ['input_time'

78710

KS检验及其在机器学习中的应用

KS检验及其在机器学习中的应用 什么是KS检验 Kolmogorov–Smirnov 检验,简称KS检验,是统计学中的一种非参数假设检验,用来检测单样本是否服从某一分布,或者两样本是否服从相同分布。...我们有假设:为此,我们构造KS统计量: 如下图,经验分布函数与目标分布的累积分布函数的最大差值就是我们要求的KS统计量: ?...image.png 两样本的KS检验 用同样的思想,我们可以检验「两个样本是否服从同一分布」,此时KS统计量为两样本的经验分布函数的最大差值 ?...ks_2samp(data1, data2) Ks_2sampResult(statistic=0.9219219219219219, pvalue=0.0) 这里KS统计量甚至超过了0.9,一般来说,...KS统计量超过0.6,就说明模型的分类能力比较强了。

2.7K20

理解逻辑回归中的ROC曲线和KS值「建议收藏」

例如预测明天的温度,23,24,25度) 分类中比较常用的是二分类(label结果为0或1两种) 2.逻辑回归不是回归 从名字来理解逻辑回归.在逻辑回归中,逻辑一词是logistics [lə’dʒɪstɪks...但是最好的阈值是不能通过这个图知道的,要通过KS曲线得出。...KS曲线的纵轴是表示TPR和FPR的值,就是这两个值可以同时在一个纵轴上体现,横轴就是阈值,,然后在两条曲线分隔最开的地方,对应的就是最好的阈值,也是该模型最好的AUC值,就比如是上图的AUC=0.810...KS值就是max(abs(TPR-FPR)),即:TPR和FPR只差最大的那个值。.../zyq11223/article/details/79085711 ROC曲线与KS曲线的理解 https://www.jianshu.com/p/07577d1f9fff 关于模型检验的ROC值和KS

1.7K20

oeasy 教您玩转linux010101查看内核uname

linux([ˈlɪnəks]) 是什么? 咱们这次讲点什么呢?这次咱们讲讲这个 linux([ˈlɪnəks]),什么是 linux([ˈlɪnəks])呢?...这linux([ˈlɪnəks])呀,其实天天和咱们打交道.咱们打车订餐玩游戏不都得访问服务器么?这linux([ˈlɪnəks])就是服务器的 kernel(内核)。...咱平常所说的 linux([ˈlɪnəks]) 操作系统的全称是 GNU/linux.单独的 linux([ˈlɪnəks]) 一般指的并不是操作系统,而是操作系统的 kernel(内核) .linux...这只企鹅叫 tux([tʌks]) , 是 linux 的吉祥物。linux吉祥物为啥是企鹅tux呢?...1996 年 5 月 12 日,linux内核 需要一个生动的形象,linux 爱好者在 邮件列表 ,里面讨论用什么吉祥物代表linux.有的说鲨鱼,有的说精灵.后来 linux 的核心作者 托瓦尔兹

78200

CentOS、Linux、ubuntu等的发音

CentOS、Linux、ubuntu等的发音的却是一件 不容易弄明白的事情,就算我们搞了几十年的计算机的人,真正叫起真来,也未必很有底气,下面我把这些发音汇总了一下,大家看完就一目了然啦!!!...CentOS(Community Enterprise Operating System,中文意思是社区企业操作系统)是Linux发行版之一,它是来自于Red Hat Enterprise Linux依照开放源代码规定释出的源代码所编译而成...依照国际音标应该是/'linэks/——类似于“里讷克斯”。 但是,由于Linus Torvalds本人是芬兰人,所以他的Linux读音不是/'linэks/,而是/'liniks/....有人综合网上和linux自己的读音,概括出几个自认为最合适也最通用的读法:/li'n^ks/(“里那克斯”)或/'li:nэks/(“里讷克斯”)或/li'nju:ks/(“里纽克斯”)。...一个Linux的发行版本,由debian衍生而来。Ubuntu的发音是“乌版图”,这个貌似公认了,官方也这样发音。

7.2K21
领券