首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

利用Python计算KS的实例详解

好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。 1、crosstab实现,计算ks的核心就是好坏人的累积概率分布,我们采用pandas.crosstab函数来计算累积概率分布。...2、roc_curve实现,sklearn库中的roc_curve函数计算roc和auc时,计算过程中已经得到好坏人的累积概率分布,同时我们利用sklearn.metrics.roc_curve来计算ks...值 3、ks_2samp实现,调用stats.ks_2samp()函数来计算。...链接scipy.stats.ks_2samp¶为ks_2samp()实现源码,这里实现了详细过程 4、直接调用stats.ks_2samp()计算ks import pandas as pd import...直接采用ks_calc_cross计算。 以上这篇利用Python计算KS的实例详解就是小编分享给大家的全部内容了,希望能给大家一个参考。

4.1K10

Python数据挖掘】应用toad包中的KS_bucket函数统计好坏样本率、KS

可以使用Python中自助查看帮助文档的方法,很方便就可以看到这个函数里面有哪些参数,这些参数需要填什么值。...四、应用KS_bucket函数计算变量的KS值 1 等频分割 接着,调用toad库下的KS_bucket函数,设置10等分等频分箱,进行数据统计分析,语句如下: d1=toad.metrics.KS_bucket...ks列统计对应分箱中累计好样本率和累计坏样本率的差值。详细的KS原理可以参考本公众号文章:模型评价指标—KS。...i all_woe = all_woe.append(d1) all_woe.to_csv('all_woe_10deg.csv', encoding='gbk') 得到结果如下: 至此,在Python...中应用toad.metrics.KS_bucket进行数据挖掘已经讲解完毕,感兴趣的同学可以自己实现一遍。

90910
您找到你想要的搜索结果了吗?
是的
没有找到

模型评价指标—KS

之前阐述了混淆矩阵,本文阐述KS的原理和Python实现实例,其它指标会在后续文章中详尽阐述,敬请期待。...一、详细介绍KS 1 什么是KS KS(Kolmogorov-Smirnov):好坏样本之间累计分布的差值(最大值),用于评估模型的风险区分能力。...二、用Python如何计算KS值并绘图 1 具体代码 在python中计算KS的具体代码如下: import matplotlib import pandas as pd import seaborn...得到结果如下: ks_value is 0.354 + at pop = 0.3002 ? ? 三、如何评价KS 我们计算出了模型的KS,那么多少的KS值,模型才是可以使用的?...根据行业内的规范,一般KS值要大于0.2才是一个可用的模型,且KS值越大模型效果越好。 但是,KS值过高,需核验模型是否使用未来变量,要谨慎使用。 具体KS值对应的模型区别能力见下表: ?

4.8K20

风控ML | 风控建模的KS

我们这做风控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。...我将会从下面几个方面来展开讲解一下KSKS的概念 KS的生成逻辑 KS的效果应用 KS实现 01 KS的概念 KS的全称叫“Kolmogorov-Smirnov“,我知道的是苏联数学家提出来的一个检验方法...03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS实现 首先我们来对上面展示的例子进行...Python代码实现。...以上的代码实现是基于分桶后的结果进行操作的,但是在大多数的情况下,都是不先进行分桶的,而是直接进行KS的计算,而计算KS的方式主要有两种: # test data y_true = np.array([

4.3K30

KS检验及其在机器学习中的应用

KS检验及其在机器学习中的应用 什么是KS检验 Kolmogorov–Smirnov 检验,简称KS检验,是统计学中的一种非参数假设检验,用来检测单样本是否服从某一分布,或者两样本是否服从相同分布。...我们有假设:为此,我们构造KS统计量: 如下图,经验分布函数与目标分布的累积分布函数的最大差值就是我们要求的KS统计量: ?...image.png 两样本的KS检验 用同样的思想,我们可以检验「两个样本是否服从同一分布」,此时KS统计量为两样本的经验分布函数的最大差值 ?...train_test_split from sklearn.linear_model import LogisticRegression 如何用Python进行KS检验 Python的scipy.stats...ks_2samp(data1, data2) Ks_2sampResult(statistic=0.9219219219219219, pvalue=0.0) 这里KS统计量甚至超过了0.9,一般来说,

2.8K20

一文完全理解模型ks指标含义并画出ks曲线(包含代码和详细解释)「建议收藏」

我也是研究了一下,终于搞清楚了ks的具体计算方式。搞清楚了计算方式后,ks的含义自然就清楚了。 下面我会详细讲解实现方法,相信如果你看完本文章,肯定可以理解ks。...本文会介绍两种计算ks的方法: 第一种是我自己手动写代码实现的,可以帮助你理解ks含义; 第二种是sklearn模块里面的roc_curve函数计算,通过第一种方法理解了ks后,实际应用中使用第二种方法...ks的计算流程 话不多说,先看代码,后面会解释代码,顺便解释清楚ks含义。...运行下面代码,得到ks曲线图 result_ks = ks(df, 'label', 'score') ks_curve(result_ks) roc_curve函数实现 上面说了计算ks其实只用得到关键的两列...下面代码中,ks_value即为ks值。

3.3K10

【自用】KS极速版sig3接口搭建

目录 前言 准备工具: 教程开始 ①安装KS极速版 ②重启模拟器 ③重启模拟器 ④Windows端 ⑤浏览器访问 免责声明: ---- 前言 提示:仅用作学习,个人感觉已经喂饭了 个人主页:@MIKE...utm_source=ydsjxy 教程开始 ①安装KS极速版 打开模拟器,双击KS极速版apk,安装KS极速版,到设置–>其他设置,打开ROOT和ADB调试。...②重启模拟器 ③重启模拟器 打开KS极速版,再打开adb工具,先用adb工具连接模拟器,输入 adb devices 找到查看设备 再输入 adb forward tcp:27042 tcp.../frida-server 这样模拟器端就配置好了 ④Windows端 没有Python的,去下载Python,去下载 安装fridaFlask``equests PyExecJs 几个依赖,   在

90220

理解逻辑回归中的ROC曲线和KS值「建议收藏」

例如预测明天的温度,23,24,25度) 分类中比较常用的是二分类(label结果为0或1两种) 2.逻辑回归不是回归 从名字来理解逻辑回归.在逻辑回归中,逻辑一词是logistics [lə’dʒɪstɪks...但是最好的阈值是不能通过这个图知道的,要通过KS曲线得出。...KS曲线的纵轴是表示TPR和FPR的值,就是这两个值可以同时在一个纵轴上体现,横轴就是阈值,,然后在两条曲线分隔最开的地方,对应的就是最好的阈值,也是该模型最好的AUC值,就比如是上图的AUC=0.810...KS值就是max(abs(TPR-FPR)),即:TPR和FPR只差最大的那个值。.../zyq11223/article/details/79085711 ROC曲线与KS曲线的理解 https://www.jianshu.com/p/07577d1f9fff 关于模型检验的ROC值和KS

1.8K20

gcForest 集成学习方法的 Python 实现

这两天终于抽空做了实现,并和自己项目中常用的集成算法(TreeNet、XGBoost)做了简单对比。下面总结一下整个算法的 Python 实现过程,以及将它应用到自己的数据集上出现的问题和解决办法。...这样,整个 gcForest 算法的 Python 运行环境就 OK 了。...from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score from python_dailyworking.Get_KS...: ',get_ks(Y_train, Y_predict_prod_train)) 上面的代码中要导入我们已经实现了的 GCForest 类(第三行),后面的模型训练和预测分类结果,跟正常的 Python...import gcForest from python_dailyworking.Get_KS import get_ks from sklearn.metrics import accuracy_score

6.4K90

Python科学计算和绘图入门

对于mayavi,安装起来比较复杂,主要是vtk的安装,我安装了几次都没有成功,不管是使用ccmake还是使用independent installer都没法用,在尝试了一个下午之后,发现了python...Canopy是Python科学计算的集成环境,里面集成了你所知道,你所需要的所有python科学计算需要的module,这是他的主页截图。 ?...我在Package Manager中直接搜索下载了mayavi,一键完成安装,特别方便,推荐所有用Python科学计算,或者是为了毕业论文等同学使用Canopy,我要是早发现就好了! ?...的绘图功能,完全不亚于matlab,matlab能做的,python里面都能实现,对于2D绘图,不管是函数图像还是数值统计图,都可以使用matplotlib库来完成。...range(1,10): ks = ks*0.1 plt.plot(fi,functionI(fi,ks,3,1,e0),label='ks='+str(ks)) plt.legend

1.9K40
领券