小石头

LV0

技术专栏

大数据建模的一点一滴TA创建的

26 文章14 关注者

全部文章

  • 模型预测概率的修正

    在很多场景中,我们只对模型的排序性能感兴趣,不太关注其预测概率,因为只要模型的排序性能没有下降,根据排序性设置一定的阈值就能够满足业务的需要。而模型预测概率的...

    小石头
  • 特征工程 | LDA降维

    判别分析是一种分类算法,并且也可作为降维技术使用。判别方法有距离判别、贝叶斯判别、Fisher判别等。而Fisher判别是最常用的方法,其基本思想是...

    小石头
    数据分析编程算法
  • Python | 排序

    原列表list上进行排序,没有返回值。参数key和reverse和sorted()函数中的参数用法一样。

    小石头
    Python编程算法
  • 特征工程 | PCA降维

    主成分分析(PCA)是一种多元统计方法,主要利用降维的思想,在损失很少信息的前提下,把多个变量转化为少数几个互不相关的综合变量,各综合变量即称为主成...

    小石头
    编程算法数据分析
  • Python | 缺失的处理

    等同于DataFrame.isnull,用于判断各个值是否为缺失,若为缺失返回True值,若为非缺失返回False值,最后返回相同结构的数据框,用法如下:

    小石头
    Python
  • 闲扯 | 信贷场景中数据使用的那点事

    本文聊聊信贷场景中数据使用的一些问题。对于持牌机构,除了查询人行征信,也会查询某些外部数据以补充人行征信覆盖不到的信息;而对于非持牌无人行征信查询资质的公...

    小石头
  • 论文翻译|Practical Lessons from Predicting Clicks on Ads at Facebook

    在线广告允许广告主只对可测量的用户响应出价和付费,例如广告点击。因此,点击预测系统是大多数在线广告系统的核心。Facebook有超过7.5亿的日活跃用户和超过...

    小石头
    机器学习神经网络深度学习AI 人工智能编程算法
  • WOE(证据权重)为何这样计算?

    先简单回顾一下WOE的含义。假设x是类别变量或分箱处理过的连续变量,含R个类别或分段,取值为{C1, ..., Cr, ..., CR};y是目标变...

    小石头
    编程算法
  • 模型评估 | Precision-Recall Curve

    最近接手的一个项目,最后被要求给出查准率-查全率曲线(Precision-Recall Curve)以及曲线对应的查准率、查全率数值序列。查准率-查...

    小石头
  • 算法 | 随机森林

    随机森林是集成学习的一种方法,是将多棵树进行集成的算法,随机是指训练每棵树的样本和变量具有随机性,而多棵树组合在一起就像“森林”一样。

    小石头
    编程算法
  • Matplotlib | 创建图形(figure)对象

    Matplotlib中有多种创建图形对象的方法,常用到的有三种,下面直接举例子说明。

    小石头
  • 模型评估 | R语言实现ROC

    上一篇是关于ROC的含义及Python的实现,现在通过R来实现ROC,实现逻辑完全一样。

    小石头
  • 模型评估 | Python实现ROC

    首先从混合矩阵说起,混合矩阵是真实类别与预测类别的交叉表,其中矩阵的行表示真实值,矩阵的列表示预测值,二分类问题的混合矩阵如下:

    小石头
  • 数值变量-卡方分箱

    卡方统计量用于评估两个名义变量(或称类别变量)的相关性是否显著,可以作为类别变量的分箱准则;但将数值变量做离散化处理后,卡方统计量同样可作为数值变量...

    小石头
    编程算法
  • 徒手撸算法 | 线性回归

    其中,x1, x2, ..., xp是预测变量,x0恒为1;θ1, θ2, ..., θp是预测变量系数(权重或参数),θ0是偏置项(截距),令θ=(θ0, θ...

    小石头
    线性回归编程算法
  • Python实现KS

    Python和R有很多相似处,本篇KS实现就是将上篇R语言方法转成Python,代码封装在函数PlotKS里,函数的逻辑可以参考上篇R语言的实现。

    小石头
    PythonR 语言
  • R语言实现KS

    将代码封装在函数PlotKS_N里,Pred_Var是预测结果,可以是评分或概率形式;labels_Var是好坏标签,取值为1或0,1代表坏客户,0...

    小石头
  • 徒手撸算法 | 逻辑回归

    逻辑回归是线性回归的改进,通过特定的连接函数将实数范围压缩到(0, 1)范围内,从而实现分类的目的。

    小石头
    线性回归编程算法
  • 算法 | 决策树

    决策树是一种基本学习方法,可用于回归和分类。回归树的分割准则一般是平均误差,而分类树的分割准则有信息增益、信息增益率、基尼指数等,下面简单梳理决策...

    小石头
    决策树机器学习神经网络深度学习AI 人工智能
  • 算法 | 朴素贝叶斯

    朴素贝叶斯是实用性很高的一种学习器,主要基于贝叶斯定理和条件独立性假设求出后验概率,将后验概率最大的类别作为预测的结果.

    小石头
    机器学习神经网络深度学习AI 人工智能编程算法

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券