专栏首页数据科学与人工智能【算法】机器学习和数据科学最常用到的TOP10算法

【算法】机器学习和数据科学最常用到的TOP10算法

数据科学的实践,需要使用算法和数据科学方法,来帮助数据专业人员从数据中提取洞察力和价值。Kaggle最近的一项调查显示,数据专家在2017年比其他数据科学方法更多地使用数据可视化、逻辑回归、交叉验证和决策树技术。展望2018年,数据专业人员对学习深度学习(41%)最感兴趣。

Kaggle于2017年8月对16,000多名数据专业人员进行了调查。 他们的调查包括数据科学,机器学习,教育等方面的各种问题。 Kaggle发布了原始调查数据,根据这些调查数据,我发现一些有趣的东西。今天的文章是关于2017年数据专业人员使用的数据科学和机器学习方法,以及2018年最令他们兴奋的机器学习/数据科学方法。

1. 2017年最受欢迎的数据科学/分析工具,技术和语言

调查包括一个针对数据专业从业人员的问题,“在工作中,你经常使用以下数据科学方法? (选择所有使用的)”。平均而言,数据专家在2017年使用了5种(中值)数据科学方法。2017年使用的前5种数据科学方法是(见图1):

  1. 数据可视化(49%)
  2. Logistic回归(42%)
  3. 交叉验证(38%)
  4. 决策树(36%)
  5. 随机森林(34%)
  6. 时间序列分析(31%)
  7. 神经网络(28%)
  8. PCA和维度降低(27%)
  9. kNN和其他聚类算法(26%)
  10. 文本分析(25%)

对于自称为“数据科学家”的数据专业人员,这些方法的使用率更高。这些数据科学家的采用率大约高出15-20个百分点(例如,66%用于数据可视化,61%用于逻辑回归, 56%为决策树,56%为随机森林)。

KDNuggets最近的一项调查发现,与目前的研究结果类似。在他们的研究中,顶级数据科学和机器学习方法还包括回归(60%),聚类(55%),可视化(51%),决策树/规则(51%)和随机森林(46%)。

2. 哪些2018年学习最为兴奋的机器学习和数据科学方法?

另一个调查是,所有数据专业人士(不管是否正在工作),了解他们在下一年最兴奋的机器学习/数据科学方法。结果显示,数据专业人员对深度学习最感兴趣:

  1. 深度学习(41%)
  2. 神经网络(13%)
  3. 时间序列分析(6%)
  4. 贝叶斯方法(5%)
  5. 文本挖掘(5%)

3. 小结

Kaggle对16,000多名数据专家的调查结果,揭示了工作中使用的最流行的数据科学方法。数据可视化和逻辑回归列在首位。

毫不奇怪,10位数据专业人士中有4位表示,他们非常高兴在明年学习深度学习。

深度学习是一类机器学习算法,它是根据大脑的信息处理和通信模式建模的。

深度学习使用单位层或节点进行特征提取和转换,每层使用前一层的输出作为输入。

深度学习方法可用于营销,汽车,语音识别等领域。

这种对学习深度学习兴趣的同时,调查结果还表明,用于深度学习的流行的开源软件TensorFlow是专业人士有兴趣学习的顶级工具数据。

本文翻译自:

http://businessoverbroadway.com/top-machine-learning-and-data-science-methods-used-at-work

本文分享自微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【陆勤阅读】三个你在书中无法学到的数据分析知识

    在大数据特别热门的今天,出现了各种培训课程。但我发现这些课程的重点都放在算法的学习上。如何理解logistic回归或深度学习的确很酷,但一旦你开始处理数据,你会...

    陆勤_数据人网
  • 【数据】数据预处理

    小编邀请您,先思考: 1 数据预处理包括哪些内容? 2 如何有效完成数据预处理? 数据的质量和包含的有用信息量是决定一个机器学习算法能够学多好的关键因素。因此,...

    陆勤_数据人网
  • 【数据】工业大数据应用

    第一是加速产品创新设计,传统的产品设计模式是基于设计师的灵感和经验,揣摩消费者的需求喜好,设计产品,针对性不强,不精确。大数据可拉近消费者与设计师的距离,精准量...

    陆勤_数据人网
  • 大数据时代个人学习篇

    牛津大学职业研究分析报告可以看到,大数据智能时代首先取代的是比较有规则的职业,如重复性、机械性的会被淘汰,终身学习、人文沟通、信息化与数字化、智能协作等方面的能...

    凹谷
  • 北大才女总结:机器学习的概念、历史和未来

    提起机器学习,我们不得不给机器学习下一个准确的定义。在直观的层面,如果说计算机科学是研究关于算法的科学,那么机器学习就是研究关于“学习算法”的科学,或者说,不同...

    double
  • 大数据的五大发展趋势

    近几年大数据被越来越广泛的运用到各个领域,也得到了企业对大数据人才的重视,许多公司开始或正在实施和扩展大数据技术应用,大数据在行业内的火爆程度,已经是互联网公司...

    加米谷大数据
  • 大数据Hadoop与Spark学习经验谈

    昨晚听了下Hulu大数据基础架构组负责人–董西成的关于大数据学习方法的直播,挺有收获的,下面截取一些PPT的关键内容,希望对正在学习大数据的人有帮助。

    chaplinthink
  • 零基础学习大数据人工智能,学习路线篇!

    大数据处理技术怎么学习呢?首先我们要学习Python语言和Linux操作系统,这两个是学习大数据的基础,学习的顺序不分前后。

    用户2292346
  • 大数据的五大发展趋势

    近几年大数据被越来越广泛的运用到各个领域,也得到了企业对大数据人才的重视,许多公司开始或正在实施和扩展大数据技术应用,大数据在行业内的火爆程度,已经是互联网公司...

    加米谷大数据
  • 从小白到大数据架构师的学习历程

    最近有很多人问我,大数据是怎么学?需要学什么技术以及这些技术的学习顺序是什么?今天我把个问题总结成文章分享给大家。 ---- 大数据处理技术怎么学习呢?首先我...

    架构师小秘圈

扫码关注云+社区

领取腾讯云代金券