小石头

LV0
发表了文章

模型预测概率的修正

在很多场景中,我们只对模型的排序性能感兴趣,不太关注其预测概率,因为只要模型的排序性能没有下降,根据排序性设置一定的阈值就能够满足业务的需要。而模型预测概率的...

小石头
发表了文章

特征工程 | LDA降维

判别分析是一种分类算法,并且也可作为降维技术使用。判别方法有距离判别、贝叶斯判别、Fisher判别等。而Fisher判别是最常用的方法,其基本思想是...

小石头
数据分析编程算法
发表了文章

Python | 排序

原列表list上进行排序,没有返回值。参数key和reverse和sorted()函数中的参数用法一样。

小石头
Python编程算法
发表了文章

特征工程 | PCA降维

主成分分析(PCA)是一种多元统计方法,主要利用降维的思想,在损失很少信息的前提下,把多个变量转化为少数几个互不相关的综合变量,各综合变量即称为主成...

小石头
编程算法数据分析
发表了文章

Python | 缺失的处理

等同于DataFrame.isnull,用于判断各个值是否为缺失,若为缺失返回True值,若为非缺失返回False值,最后返回相同结构的数据框,用法如下:

小石头
Python
发表了文章

闲扯 | 信贷场景中数据使用的那点事

本文聊聊信贷场景中数据使用的一些问题。对于持牌机构,除了查询人行征信,也会查询某些外部数据以补充人行征信覆盖不到的信息;而对于非持牌无人行征信查询资质的公...

小石头
发表了文章

论文翻译|Practical Lessons from Predicting Clicks on Ads at Facebook

在线广告允许广告主只对可测量的用户响应出价和付费,例如广告点击。因此,点击预测系统是大多数在线广告系统的核心。Facebook有超过7.5亿的日活跃用户和超过...

小石头
机器学习神经网络深度学习AI 人工智能编程算法
发表了文章

WOE(证据权重)为何这样计算?

先简单回顾一下WOE的含义。假设x是类别变量或分箱处理过的连续变量,含R个类别或分段,取值为{C1, ..., Cr, ..., CR};y是目标变...

小石头
编程算法
发表了文章

模型评估 | Precision-Recall Curve

最近接手的一个项目,最后被要求给出查准率-查全率曲线(Precision-Recall Curve)以及曲线对应的查准率、查全率数值序列。查准率-查...

小石头
发表了文章

算法 | 随机森林

随机森林是集成学习的一种方法,是将多棵树进行集成的算法,随机是指训练每棵树的样本和变量具有随机性,而多棵树组合在一起就像“森林”一样。

小石头
编程算法
发表了文章

Matplotlib | 创建图形(figure)对象

Matplotlib中有多种创建图形对象的方法,常用到的有三种,下面直接举例子说明。

小石头
发表了文章

模型评估 | R语言实现ROC

上一篇是关于ROC的含义及Python的实现,现在通过R来实现ROC,实现逻辑完全一样。

小石头
发表了文章

模型评估 | Python实现ROC

首先从混合矩阵说起,混合矩阵是真实类别与预测类别的交叉表,其中矩阵的行表示真实值,矩阵的列表示预测值,二分类问题的混合矩阵如下:

小石头
发表了文章

数值变量-卡方分箱

卡方统计量用于评估两个名义变量(或称类别变量)的相关性是否显著,可以作为类别变量的分箱准则;但将数值变量做离散化处理后,卡方统计量同样可作为数值变量...

小石头
编程算法
发表了文章

徒手撸算法 | 线性回归

其中,x1, x2, ..., xp是预测变量,x0恒为1;θ1, θ2, ..., θp是预测变量系数(权重或参数),θ0是偏置项(截距),令θ=(θ0, θ...

小石头
线性回归编程算法
发表了文章

Python实现KS

Python和R有很多相似处,本篇KS实现就是将上篇R语言方法转成Python,代码封装在函数PlotKS里,函数的逻辑可以参考上篇R语言的实现。

小石头
PythonR 语言
发表了文章

R语言实现KS

将代码封装在函数PlotKS_N里,Pred_Var是预测结果,可以是评分或概率形式;labels_Var是好坏标签,取值为1或0,1代表坏客户,0...

小石头
发表了文章

徒手撸算法 | 逻辑回归

逻辑回归是线性回归的改进,通过特定的连接函数将实数范围压缩到(0, 1)范围内,从而实现分类的目的。

小石头
线性回归编程算法
发表了文章

算法 | 决策树

决策树是一种基本学习方法,可用于回归和分类。回归树的分割准则一般是平均误差,而分类树的分割准则有信息增益、信息增益率、基尼指数等,下面简单梳理决策...

小石头
决策树机器学习神经网络深度学习AI 人工智能
发表了文章

算法 | 朴素贝叶斯

朴素贝叶斯是实用性很高的一种学习器,主要基于贝叶斯定理和条件独立性假设求出后验概率,将后验概率最大的类别作为预测的结果.

小石头
机器学习神经网络深度学习AI 人工智能编程算法

个人简介

个人成就

  • 影响力总排行第 4580 名
  • 获得 64 次赞同
  • 文章被阅读 4K 次

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动