三猫

LV1
发表了文章

图片相似度识别:aHash算法

aHash、pHash、dHash是常用的图像相似度识别算法,原理简单,实现方便,个人把这三个算法作为学习图片相似度识别的入门算法。本次起,从aHash开始,对...

三猫
OpenCV编程算法Mac OS图像处理
发表了文章

聚类模型评价(python实现)

评价指标分为外部指标和内部指标两种,外部指标指评价过程中需要借助数据真实情况进行对比分析的指标,内部指标指不需要其他数据就可进行评估的指标。下表中列出了几个常用...

三猫
发表了文章

如何进行用户价值细分?RFM模型! Part 2 人群优惠敏感度案例

在之前的文章中我们介绍了RFM模型的基本知识,主要是根据消费相关的三个维度通过聚类,对人群进行划分(回顾可戳如何进行用户价值细分?RFM模型!Part 1 基础...

三猫
Python数据分析
发表了文章

如何进行用户价值细分?RFM模型! Part 1 基础知识

重视用户留存是目前企业发展的共识之一,借助RFM模型对人群细分从而对用户进行精细化运营,是提升留存的重要方法。本文首先带你来了解到底什么是RFM模型。

三猫
黑客网络安全安全
发表了文章

我用Python画了个“一拳超人”

Turtle库是Python中一个非常好玩的画图小工具。可以想象一个小乌龟在纸上爬,爬出了一个有趣的图案。为了熟悉Turtle的使用,我用它画了个“一拳超人”!

三猫
Python
发表了文章

R语言中的因子型变量

R语言的数据类型中,因子(Factor)型比较特殊,也让许多初学者感到难以理解。其实就像整型用来存储整数、字符型用来存储字符或字符串类似,因子型是用来存储类别的...

三猫
编程算法R 语言
发表了文章

为什么相比于RNN,LSTM在梯度消失上表现更好

对于深度学习模型,在train参数的时候,需要采用随机梯度下降方法(SGD,Stochastic Gradient Descent):

三猫
发表了文章

PU-learing:解决正负样本不足利器(R语言)

在实际分类场景中,经常会遇到类似这样的问题:只有标记了的正样本,和未标记的样本。比如金融风控场景,有一部分用户被标记为欺诈用户,剩下的用户未被标记,虽然这其中大...

三猫
编程算法机器学习神经网络深度学习
发表了文章

R语言包的安装

r语言的包中,集成了众多函数,大大扩展了r的功能且降低了使用难度。本篇文章就来介绍r语言中包的两种安装方式:install.packages和从github安装...

三猫
GitHubGit开源
发表了文章

不同预测算法比较实例(R语言)

预测算法种类很多,不论是为实际问题选择更好的分类器,还是模型优化中判断模型效果,都需要比较不同算法之间的优劣。本文我们将借助样本数据,演示从数据处理-训练-预测...

三猫
编程算法R 语言
发表了文章

峰度与偏度(python)

偏度和峰度是描述数据分布时两个常用的概念,用来描述数据分布与正态分布的偏离程度。本次推送将简要介绍其相关意义,及通过python中pandas包实现相关计算。

三猫
Python
发表了文章

关联分析(4):购物篮数据转换R语言

我们现在有这样一份数据,记录了近173万用户的爱好情况(数据为随机生成)。数据中每行为一个用户,每列为一个爱好属性,“y”代表有此爱好,“n”代表无此爱好,我们...

三猫
IDE数据分析
发表了文章

随机森林(R语言)

随机森林可处理大量输入变量,并且可以得到变量重要性排序,在实际中,有广泛应用。本文简要展示R语言实现随机森林的示例代码,并通过F值判断模型效果。

三猫
其他
发表了文章

最小二乘法来源(翻译)

Q:这个在数值算法中不成问题,LASSO回归中就用到了绝对值。而且,为什么不是计算x的4次方,或log(1+x^2)?将误差进行乘方计算有什么好处?

三猫
其他
发表了文章

WOE与IV值

计算WOE和IV是评分卡模型的一个重要环节,之前没有仔细研究过,但总觉得他们既然可以放在评分卡模型中去解决相应的问题,那应该也可以放在其他模型中解决相似的问题,...

三猫
其他

个人简介

个人成就

  • 获得 314 次赞同
  • 文章被阅读 22.9K 次

扫码关注云+社区

领取腾讯云代金券