【算法】机器学习和数据科学最常用到的TOP10算法

数据科学的实践,需要使用算法和数据科学方法,来帮助数据专业人员从数据中提取洞察力和价值。Kaggle最近的一项调查显示,数据专家在2017年比其他数据科学方法更多地使用数据可视化、逻辑回归、交叉验证和决策树技术。展望2018年,数据专业人员对学习深度学习(41%)最感兴趣。

Kaggle于2017年8月对16,000多名数据专业人员进行了调查。 他们的调查包括数据科学,机器学习,教育等方面的各种问题。 Kaggle发布了原始调查数据,根据这些调查数据,我发现一些有趣的东西。今天的文章是关于2017年数据专业人员使用的数据科学和机器学习方法,以及2018年最令他们兴奋的机器学习/数据科学方法。

1. 2017年最受欢迎的数据科学/分析工具,技术和语言

调查包括一个针对数据专业从业人员的问题,“在工作中,你经常使用以下数据科学方法? (选择所有使用的)”。平均而言,数据专家在2017年使用了5种(中值)数据科学方法。2017年使用的前5种数据科学方法是(见图1):

  1. 数据可视化(49%)
  2. Logistic回归(42%)
  3. 交叉验证(38%)
  4. 决策树(36%)
  5. 随机森林(34%)
  6. 时间序列分析(31%)
  7. 神经网络(28%)
  8. PCA和维度降低(27%)
  9. kNN和其他聚类算法(26%)
  10. 文本分析(25%)

对于自称为“数据科学家”的数据专业人员,这些方法的使用率更高。这些数据科学家的采用率大约高出15-20个百分点(例如,66%用于数据可视化,61%用于逻辑回归, 56%为决策树,56%为随机森林)。

KDNuggets最近的一项调查发现,与目前的研究结果类似。在他们的研究中,顶级数据科学和机器学习方法还包括回归(60%),聚类(55%),可视化(51%),决策树/规则(51%)和随机森林(46%)。

2. 哪些2018年学习最为兴奋的机器学习和数据科学方法?

另一个调查是,所有数据专业人士(不管是否正在工作),了解他们在下一年最兴奋的机器学习/数据科学方法。结果显示,数据专业人员对深度学习最感兴趣:

  1. 深度学习(41%)
  2. 神经网络(13%)
  3. 时间序列分析(6%)
  4. 贝叶斯方法(5%)
  5. 文本挖掘(5%)

3. 小结

Kaggle对16,000多名数据专家的调查结果,揭示了工作中使用的最流行的数据科学方法。数据可视化和逻辑回归列在首位。

毫不奇怪,10位数据专业人士中有4位表示,他们非常高兴在明年学习深度学习。

深度学习是一类机器学习算法,它是根据大脑的信息处理和通信模式建模的。

深度学习使用单位层或节点进行特征提取和转换,每层使用前一层的输出作为输入。

深度学习方法可用于营销,汽车,语音识别等领域。

这种对学习深度学习兴趣的同时,调查结果还表明,用于深度学习的流行的开源软件TensorFlow是专业人士有兴趣学习的顶级工具数据。

本文翻译自:

http://businessoverbroadway.com/top-machine-learning-and-data-science-methods-used-at-work

原文发布于微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文发表时间:2018-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏周景超的专栏

腾讯 AI Lab 计算机视觉中心人脸 & OCR团队近期成果介绍(3)

在上一期中介绍了我们团队部分已公开的国际领先的研究成果,近期我们有些新的成果和大家进一步分享。

5182
来自专栏数据科学与人工智能

【原理】机器学习欠拟合与过拟合

小编邀请您,先思考: 1 什么是欠拟合? 2 什么是过拟合? 在数据科学学科中, 过度拟合(overfit)模型被解释为一个从训练集(training set)...

45514
来自专栏机器学习算法原理与实践

协同过滤推荐算法总结

    推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤...

1992
来自专栏AI研习社

“回归分析”真的算是“机器学习”吗?

是什么将“统计”从“机器学习”中分离出来的? 这是一个被讨论过无数次的问题。关于这个问题的文章有很多,人们对其好坏莫衷一是。但是我发现,在“统计”和“机器学习”...

3724
来自专栏AI科技评论

干货 | “回归分析”真的算是“机器学习”吗?

是什么将“统计”从“机器学习”中分离出来的?个被讨论过无数次的问题。关于这个问题的文章有很多,人们对其好坏莫衷一是。但是我发现,在“统计”和“机器学习”的争论上...

3267
来自专栏新智元

【重磅】微软AI首席科学家邓力:深度学习技术及趋势报告(75页PPT下载)

【新智元导读】微软人工智能首席科学家邓力博士在上海IEEE-ICASSP2016大会上的演讲报告。本报告分为深度学习的机器感知、机器认知和未来挑战三大部分,着重...

4268
来自专栏人工智能头条

入坑机器学习,十个知识点你不得不知

1452
来自专栏专知

【干货】剑桥大学Alex Kendall 208页博士论文-计算机视觉深度学习中的几何结构与不确定性

【导读】计算机视觉(Computer Vision)是一门多学科科学,致力于让机器具备“看”的能力。 这个问题是很具有挑战性的,因为我们从现实的视觉世界中观察到...

2364
来自专栏一个爱吃西瓜的程序员

什么是数据挖掘?

近年来,数据分析,数据挖掘和数据科学等领域不可谓不火热。而且人工智能、算法、数据科学领域的薪酬普遍高于传统互联网行业。既然决定从事互联网行业,那就得给自己找一个...

3309
来自专栏AI科技评论

360 副总裁颜水成教授: 深度学习的研发目标及 1×1 卷积的功能 | CCF-GAIR 2017

7 月 7 日,雷锋网承办的第二届 CCF-GAIR 全球人工智能与机器人峰会在深圳如期开幕。奇虎 360 副总裁、首席科学家、IEEE Fellow、IAPR...

2867

扫码关注云+社区

领取腾讯云代金券