前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【连载干货】中国人民大学统计数据挖掘中心专题报告资料之回归分析与Lasso

【连载干货】中国人民大学统计数据挖掘中心专题报告资料之回归分析与Lasso

作者头像
量化投资与机器学习微信公众号
发布2018-01-29 11:10:49
6140
发布2018-01-29 11:10:49
举报

谢谢大家支持,可以让有兴趣的人关注这个公众号。让知识传播的更加富有活力,谢谢各位读者。 很多人问我为什么每次的头像是奥黛丽赫本,我只能说她是我女神,每天看看女神也是不错的嘛!

从今天起,每天为大家分享一篇中国人民大学数据挖掘中心(DMC)的统计专题报告,内容很丰富,专业性和学习行都很强,希望大家有所收获。所有版权均属中国人民大学数据挖掘中心,请勿用作商业用途!!!

什么是Lasso

Lasso是最小二乘的一个改进

核心是加入了惩罚项

效果是变量选择

开创了一个近二十年的领域

喂饱了不少统计学家

变量选择

什么是变量选择?

在回归模型中,选择最能够解释Y的解释变量的过程,称为变量选择。

不做变量选择的后果:

一、严重的多重共线性

二、计算量大

三、数据成本昂贵

常见的变量选择方法:

前进法、后退法、逐步回归法 Lasso

一张图理解LASSO!

相关知识补充

关于模型选择的标准:

一,模型的准确性(prediction accuracy)

二,模型的可解释性(parsimony)

例子:

1,变量选择模型,比如向前法、向后法、逐步回归,可解释性较好,但是预测的准确性较差。

2,岭回归的准确性较好,但是可解释性较差。

3,Lasso很好的平衡了模型的准确性和模型的可解释性,但是运算量比较大。

对于岭回归的再理解

由于文章很长,同时包含很多例子。我已经把整理好把连接放在阅读原文里,大家可以下载自学。好好学哦!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档