业界 | 数据科学家要先学逻辑回归?图样图森破!

大数据文摘编译作品

编译:王梦泽、笪洁琼 、夏雅薇

逻辑回归的结果很难解读,在真实的商业环境中考虑到你要跟你的老板或同事解释模型的时候,有可能自己都无法解释清楚,所以慎用纯粹的逻辑回归,尤其是对于初学者来说,这是作者对逻辑回归的建议。

近期,数据科学圈出现了不少“数据科学家应最先学习逻辑回归”的声音。作为一名与市场营销人员、销售人员、工程师一起工作的“孤立的”统计学家,我深深反对这一说法!

有许多工作尤其是生物统计领域都要求从业人员能够掌握并运用逻辑回归的知识。如果你在大学曾学过一些逻辑回归,这会对你很有帮助,但对于初学者来说,它并不是入门课程。

在我的职业生涯中,我可以灵活地选择使用哪些方法和工具,如今许多从业者都处于类似的环境中。

因此有一定的几率,初学者在对逻辑回归的原理了解很少的情况下,使用像黑盒工具一样的逻辑回归,然后把自己拉入深坑。

下面列出了5条逻辑回归应放在最后学习的理由:

  • 存在着上百种不同类型的逻辑回归,一些适用于分类变量,一些适用于特定的分布(例如泊松分布)。专家在使用时也常常感到困惑,初学者和你的老板更会如此。
  • 转换因变量后(通常是比例或二值型因变量,例如本文观点正确/错误),问题就变成了线性回归。虽然纯粹主义者声称实际的逻辑回归模型更精确,然而相较于模型的精确度,数据的质量才是至关重要的。如果数据有20%的噪声,或者理论模型是对实际情况的粗略估计,那么模型精确度高出1%并没有实际用处。
  • 除非能够妥善处理(例如使用ridge或Lasso回归),否则在噪声、缺失值和脏数据的影响下会导致模型过度拟合及缺乏稳健性(使用例如梯度优化等技术的迭代算法)。
  • 逻辑回归的系数不容易解释。当你对决策者或者其他部门解释模型时,很少有人能够理解。
  • 最好的模型通常会将多种方法混合到一起,以便能尽可能多的获得/解释差异。在我作为数据科学家长达30年的职业生涯中,从未使用过纯逻辑回归,但我开发出了一项更加稳健且便于使用及编程的混合技术,结果也容易解读。它将“不纯的”逻辑回归和“不纯的”决策树混合在一起,效果十分显著,尤其是对于你的“不纯”数据评分时。详情请戳。

相关报道:

https://www.datasciencecentral.com/profiles/blogs/why-logistic-regression-should-be-the-last-thing-you-learn-when-b

【今日机器学习概念】

Have a Great Definition

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-05-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

从基线模型开始:别担心,模型最开始都让人不忍直视

1095
来自专栏AI科技评论

干货 | 清华博士生孙奕帆:行人再识别论文介绍及最新进展

AI 科技评论按:提到计算机视觉领域的研究,大家可能最先想到的是人脸识别,其实还有一个更为实用的研究应用——行人再识别。行人再识别是利用计算机视觉技术在图像或视...

3345
来自专栏AI研习社

学不学吴恩达 deeplearning.ai 课程,看完这篇你就知道了

AI 研习社按:本文的作者是 Thomas Treml,是一名具有社会学背景的数据科学自由职业者。他在 Medium 上分享了自己学习 deeplearning...

741
来自专栏CDA数据分析师

应用 AI 之前,你必须了解的 10 项准备工作

? 这篇文章对你的人工智能和机器学习项目进行分解,讨论其各个部分所带来的影响,从而帮助你确定公司是否真正准备利用机器学习、深度学习或人工智能。 不是每一个问题...

1869
来自专栏SIGAI学习与实践平台

如何又“准”又“狠”地成为优秀算法工程师

怎样成为一名优秀的算法工程师?这是很多从事人工智能学术研究和产品研发的同学都关心的一个问题。面对市场对人才的大量需求与供给的严重不足,以及高薪水的诱惑,越来越多...

1233
来自专栏AI科技评论

干货 | AutoML 和神经架构搜索初探

AI 科技评论按:本文由「图普科技」编译自 An Opinionated Introduction to AutoML and Neural Architect...

1022
来自专栏新智元

重磅 | 谷歌发布Graph Learning平台,解密图像识别核心技术(附论文)

近来机器学习突飞猛进使计算机系统能够解决现实世界中的复杂问题。其中之一便是谷歌的大规模、基于图的机器学习平台,这是由 Google Research 的 Exp...

4437
来自专栏AI科技评论

大会直击|微软亚洲研究院刘铁岩:深度学习成功的秘密

9月9日,2016湖南人工智能湖南论坛在长沙举办,大会期间,来自国内外的许多顶级专家在会上给我们做了报告,下面是雷锋网根据微软亚洲研究院刘铁岩教授的现场精华整理...

3346
来自专栏何俊林

【一】如果让我学习TensorFlow,我该怎么学?

熟悉我的读者知道,我一直以来就是做Android开发/音视频开发,对于什么人工智能,什么TensorFlow,什么机器学习,我也是小白,按照惯例,在学习一个新东...

2509
来自专栏CreateAMind

中文简短的《神经网络与深度学习》极佳入门书-出自量子物理学家

801

扫码关注云+社区