【SPA大赛】LR模型的简单使用教程

1、 什么是 LR 模型

LR ( Logistic Regression ) 是在线性回归的基础上,套用了一个逻辑函数。 而回归是一种及其简单的模型,我们一个普通的二元函数 y=f(x),就属于回归的一种。它虽然简单,但是它有一个极其致命的缺点:线性回归的鲁棒性很差。这使回归模型在机器学习领域上表现很一般。但是套用了逻辑函数之后,逻辑回归模型在克服了线性回归鲁棒性差这个缺点,使得它在机器学习上面有了一席之地。像腾讯算法大赛这类二分类问题,就可以用逻辑回归来实现。

2、 LR 模型的代码实现

首先导入必要的工具包:

接着用pandas工具包里面的read_csv()函数把训练集和测试集导入:

分离出特征值和label,在下面的代码中,column_name是特征值名字的列表,如‘age’,’ positionID’,…..:

从sklearn.linear_model里导入LogisticRegression。

在Python中提供了LR模型,我们直接引入相应的包就可以使用LR模型:

引入相应的模型后,我们就可以调用LogisticRegression中的fit函数用来训练模型参数:

模型训练好了之后,接下来就是进行结果的预测了。

其中result是predict_proba产生的一个预测概率,由此我们得到了腾讯算法大赛要求的概率将其输出既可得到所要的zip文件,具体实现在官方的baseline中有相应的代码实现,在此不再赘述,附上官方baseline的链接,有需要的同学可以参考:腾讯社交广告算法大赛 Baseline

3、 LR模型对维度过大的特征值的处理

为了使得预测结果不会被某些维度过大的特征值而主导。Python中提供了标准化数据相应的函数,保证每个维度的特征数据方差为1,均值为0。由此让我们的LR模型对此次算法大赛中一些离散度较高的特征有了应对之策,例如下图的positionID,数据大小相差较大,会导致结果受到影响,使用标准化处理可以避免这个问题,使得我们可以得到一个更好的成绩。

以上即为LR模型结合本次腾讯算法大赛的简单使用教程,如有错误,欢迎大家指出!

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

李润凯的专栏

1 篇文章1 人订阅

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习、深度学习

统计学习导论 Chapter5 -- Resampling Methods

Book: An Introduction to Statistical Learning with Applications in R http:...

28860
来自专栏机器学习实践二三事

机器学习基本概念-3

前两篇介绍了ML中的一些基本概念,还有一些很重要的概念也还没有说到,作为入门教程还是需要直观点,所以先举个最简单的例子线性回归(linear regresion...

23280
来自专栏人工智能

向量自回归简介

通常,我们试图分析大量的数据来找到有用的信息或预测未来的事件。数据集中最重要的类型之一是时间序列。时间序列表示按时间顺序索引的一系列数据点。有很多模型来分析这种...

84410
来自专栏人工智能

深入浅出机器学习-线性回归Linear regression

线性回归: 1.函数模型(Model): ? 假设有训练数据 那么为了方便我们写成矩阵的形式 ? 2.损失函数(cost): 现在我们需要根据给定的X求解W的值...

24910
来自专栏深度学习思考者

Linear Regression/线性回归与正则化(Andrew Ng 机器学习 一 )

线性回归 用一个线性函数对提供的已知数据进行拟合,最终得到一个线性函数,使这个函数满足我们的要求(如具有最小平方差,随后我们将定义一个代价函数,使这个目标量化)...

22970
来自专栏Small Code

【TensorFlow】TensorFlow的线性回归

前面 有篇博文 讲了讲Ubuntu环境下安装TensorFlow,今天来说一说在TensorFlow中如何进行线性回归。 训练数据 本次使用的训练数据是美国房价...

56790
来自专栏张洁的专栏

线性回归的高斯假设

在线性回归问题中,我们定义了损失函数,但是为什么用最小二乘(而不是三次方等)作为损失函数? 我们来尝试解决一个完整的线性回归问题。

76900
来自专栏YoungGy

ML基石_LinearModelsForClassfication

retro start linear models for 01 classification 回顾线性模型 误差函数分析 解决步骤 stochastic gr...

20370
来自专栏机器学习实践二三事

sklearn系列之----线性回归

原理 线性回归,原理很简单,就是拟合一条直线使得损失最小,损失可以有很多种,比如平方和最小等等; ? y是输出,x是输入,输出是输入的一个线性组合。...

24270

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励