# Python实现KS

Python和R有很多相似处，本篇KS实现就是将上篇R语言方法转成Python，代码封装在函数PlotKS里，函数的逻辑可以参考上篇R语言的实现。

```def PlotKS(preds, labels, n, asc):

# preds is score: asc=1
# preds is prob: asc=0

pred = preds # 预测值

if asc == 1:
ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, True])
elif asc == 0:
ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, True])
ksds1.index = range(len(ksds1.pred))
ksds1['cumsum_good1'] = 1.0*ksds1.good.cumsum()/sum(ksds1.good)

if asc == 1:
ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, False])
elif asc == 0:
ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, False])
ksds2.index = range(len(ksds2.pred))
ksds2['cumsum_good2'] = 1.0*ksds2.good.cumsum()/sum(ksds2.good)

# ksds1 ksds2 -> average
ksds['cumsum_good2'] = ksds2['cumsum_good2']
ksds['cumsum_good'] = (ksds['cumsum_good1'] + ksds['cumsum_good2'])/2

# ks
ksds['tile0'] = range(1, len(ksds.ks) + 1)
ksds['tile'] = 1.0*ksds['tile0']/len(ksds['tile0'])

qe = list(np.arange(0, 1, 1.0/n))
qe.append(1)
qe = qe[1:]

ks_index = Series(ksds.index)
ks_index = ks_index.quantile(q = qe)
ks_index = np.ceil(ks_index).astype(int)
ks_index = list(ks_index)

ksds = ksds.loc[ks_index]
ksds = ksds[['tile', 'cumsum_good', 'cumsum_bad', 'ks']]
ksds0 = np.array([[0, 0, 0, 0]])
ksds = np.concatenate([ksds0, ksds], axis=0)
ksds = DataFrame(ksds, columns=['tile', 'cumsum_good', 'cumsum_bad', 'ks'])

ks_value = ksds.ks.max()
ks_pop = ksds.tile[ksds.ks.idxmax()]
print ('ks_value is ' + str(np.round(ks_value, 4)) + ' at pop = ' + str(np.round(ks_pop, 4)))

# chart
plt.plot(ksds.tile, ksds.cumsum_good, label='cum_good',
color='blue', linestyle='-', linewidth=2)

color='red', linestyle='-', linewidth=2)

plt.plot(ksds.tile, ksds.ks, label='ks',
color='green', linestyle='-', linewidth=2)

plt.axvline(ks_pop, color='gray', linestyle='--')
plt.axhline(ks_value, color='green', linestyle='--')
plt.axhline(ksds.loc[ksds.ks.idxmax(), 'cumsum_good'], color='blue', linestyle='--')
plt.title('KS=%s ' %np.round(ks_value, 4) +
'at Pop=%s' %np.round(ks_pop, 4), fontsize=15)

return ksds```

0 条评论

• ### Python | 缺失的处理

等同于DataFrame.isnull，用于判断各个值是否为缺失，若为缺失返回True值，若为非缺失返回False值，最后返回相同结构的数据框，用法如下：

• ### 特征工程 | LDA降维

判别分析是一种分类算法，并且也可作为降维技术使用。判别方法有距离判别、贝叶斯判别、Fisher判别等。而Fisher判别是最常用的方法，其基本思想是...

• ### WOE(证据权重)为何这样计算？

先简单回顾一下WOE的含义。假设x是类别变量或分箱处理过的连续变量，含R个类别或分段，取值为{C1, ..., Cr, ..., CR}；y是目标变...

• ### frustum-pointnet代码调试bug集锦与解决方法总结

众所周知，frustum-pointnet是斯坦福大学PointNet作者Chales大神的成果，将pointnet用到了目标检测中，测试数据集是KITTI。该...

• ### 不限容量的网盘---可作为电脑磁盘

慧能：哈哈，你的时间你自己要管理好，我们程序中有时也会记录下某一个函数或者某一段程序所花费的时间

• ### RxJava for Android学习笔记

Android工程引入RxJava-android 请引入Rxandroid库： compile 'io.reactivex:rxandroid:1.2.1' ...

• ### 互联网早知道

1、反欺诈白皮书 ：男人更容易受骗，广东受骗人数最多 2、阿里组织架构调整：天猫升级为“大天猫” 3、百度将推出智能小游戏Layabox完成引擎适配支持 4、苹...

• ### 微软开源 C++ REST SDK

微软的代号为Casablanca的C++ REST SDK已经基于Apache许可证开源。它被描述为“微软为了以原生代码支持基于云的客户端/服务器通信所做的努力...

• ### Hystrix 自动降级与依赖隔离1.背景2.Hystrix说明

目前对于一些非核心操作，如增减库存后保存操作日志 发送异步消息时（具体业务流程），一旦出现MQ服务异常时，会导致接口响应超时，因此可以考虑对非核心操作引入服务降...