【SPA大赛】LR模型的简单使用教程

1、 什么是 LR 模型

LR ( Logistic Regression ) 是在线性回归的基础上,套用了一个逻辑函数。 而回归是一种及其简单的模型,我们一个普通的二元函数 y=f(x),就属于回归的一种。它虽然简单,但是它有一个极其致命的缺点:线性回归的鲁棒性很差。这使回归模型在机器学习领域上表现很一般。但是套用了逻辑函数之后,逻辑回归模型在克服了线性回归鲁棒性差这个缺点,使得它在机器学习上面有了一席之地。像腾讯算法大赛这类二分类问题,就可以用逻辑回归来实现。

2、 LR 模型的代码实现

首先导入必要的工具包:

接着用pandas工具包里面的read_csv()函数把训练集和测试集导入:

分离出特征值和label,在下面的代码中,column_name是特征值名字的列表,如‘age’,’ positionID’,…..:

从sklearn.linear_model里导入LogisticRegression。

在Python中提供了LR模型,我们直接引入相应的包就可以使用LR模型:

引入相应的模型后,我们就可以调用LogisticRegression中的fit函数用来训练模型参数:

模型训练好了之后,接下来就是进行结果的预测了。

其中result是predict_proba产生的一个预测概率,由此我们得到了腾讯算法大赛要求的概率将其输出既可得到所要的zip文件,具体实现在官方的baseline中有相应的代码实现,在此不再赘述,附上官方baseline的链接,有需要的同学可以参考:腾讯社交广告算法大赛 Baseline

3、 LR模型对维度过大的特征值的处理

为了使得预测结果不会被某些维度过大的特征值而主导。Python中提供了标准化数据相应的函数,保证每个维度的特征数据方差为1,均值为0。由此让我们的LR模型对此次算法大赛中一些离散度较高的特征有了应对之策,例如下图的positionID,数据大小相差较大,会导致结果受到影响,使用标准化处理可以避免这个问题,使得我们可以得到一个更好的成绩。

以上即为LR模型结合本次腾讯算法大赛的简单使用教程,如有错误,欢迎大家指出!

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

李润凯的专栏

1 篇文章1 人订阅

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CSDN技术头条

使用GPU和Theano加速深度学习

【编者按】GPU因其浮点计算和矩阵运算能力有助于加速深度学习是业界的共识,Theano是主流的深度学习Python库之一,亦支持GPU,然而Theano入门较难...

2025
来自专栏新智元

谷歌GAN 实验室来了!迄今最强可视化工具,在浏览器运行GAN

Google AI和乔治亚理工学院的研究人员发布了一个学习GAN的交互式网站:GAN Lab!由TensorFlow.js 驱动,在浏览器就可以运行GAN,非常...

563
来自专栏新智元

【实战】重现DeepMind星际争霸强化学习算法

【新智元导读】本文主要介绍DeepMind的星际争霸强化学习算法,由于原论文作者没有开源他们的代码,所以我们尝试重现论文中的结果,并且达到了DeepMind基准...

4605
来自专栏应用案例

2017年度盘点:15个最流行的GitHub机器学习项目

作者:Sunil Ray 在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家...

1848
来自专栏大数据智能实战

基于seq2seq的中国古诗词自动生成技术

文本生成技术是深度学习赋予自然语言处理一项全新的技术,而刚好网上有这方面诸多的例子,因此趁着有空实现一下中国古诗的自动生成技术,还是挺好玩的。 具体步骤主要...

24510
来自专栏QQ会员技术团队的专栏

人人都可以做深度学习应用:入门篇

一、人工智能和新科技革命 2017年围棋界发生了一件比较重要事,Master(Alphago)以60连胜横扫天下,击败各路世界冠军,人工智能以气势如虹的姿态出现...

2348
来自专栏xingoo, 一个梦想做发明家的程序员

吴恩达机器学习笔记 —— 3 线性回归回顾

630
来自专栏企鹅号快讯

2017年度盘点:15个最流行的GitHub机器学习项目

在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家学习、使用有所帮助。另,小...

2156
来自专栏瓜大三哥

图像识别(自己训练模型)

1.数据集:从VGG网下载,这是一些各种猫和狗的图片(每个文件夹下面大约200张图片,有点少,所以训练的结果并不是很好,最好是上万的数据) ? 2.做得图像识...

2437
来自专栏小詹同学

人脸识别(一)——从零说起

人脸识别的英文名称是 Face Recognition,前段时间查找资料学的时候发现,不少人将人脸识别和人脸检测(Face Detection)混为一谈,很大...

35710

扫码关注云+社区