【机器学习工具榜单】Tensorflow最多使用,Python 取代 R 成最受欢迎编程语言


新智元报道

来源:kdnuggets

编译:肖琴

【新智元导读】近日,KDnuggets网站公布了2018年度的数据科学和机器学习工具调查结果。2300多名参与者对自己“过去 12 个月内在项目开发中使用过的数据挖掘 / 机器学习工具和编程语言”进行了投票。

近日,KDnuggets网站公布了2018年度的数据科学和机器学习工具调查结果。2300多名参与者对自己“过去 12 个月内在项目开发中使用过的数据挖掘 / 机器学习工具和编程语言”进行了投票。

最受欢迎的分析、数据科学、机器学习工具

图1:2018年最受欢迎的分析/数据科学/机器学习工具,以及与2016~2017年调查结果的对比

下表列举了最受欢迎的前11个工具,其中每个的占比都达到20%以上。

表1:2018年最受欢迎的分析/数据科学/ 机器学习软件Top 10

上表中,2018 % share 是指使用这个工具的人占所有投票者的百分比,% change是指2018年相较2017年的投票变化。

每个受访者平均使用的工具数量为7.0个,略高于2017年的6.75个(排除了只选择1个工具的投票)。

与2017年的软件调查相比,今年新进入Top 10的是Keras。

Python取代R成为最受欢迎的编程语言

调查结果显示,Python在2017年调查中的占比已经超过50%,今年更是增加到66%,而R语言的占比自这个调查开始以来(今年是第19届)第一次下降到低于50%。

RapidMiner受欢迎程度大幅提高

在过去几次调查中,RapidMiner都是排名最高的数据科学平台,今年其占比从2017年的33%上升到50%。不过,这是由于RapidMiner采取了一些措施鼓励他们的用户参与该调查。

SQL排名保持稳定

SQL,包括Spark SQL和SQL to Hadoop工具,在过去的3次投票中每一次都有大约40%的投票占比。所以,如果你是数据科学家,学习SQL吧——它很可能在很长一段时间里都很有用。

趋势

下表列举了使用率增幅达到 20% 及以上,且2018 年使用率达到 3% 以上的工具。

表2:使用率增幅最大的主要分析/数据科学/机器学习工具

我们注意到,在2017年使用率达到2%或更高的56个工具中,有19个(约三分之一)在2018年使用率有所上升,而其余37个的使用率下降了。这和近期的几起收购(Datawatch收购Angoss, Minitab收购Salford)一起表明,数据科学平台的整合正在进行中。

下表列举了在2017年使用率至少有3%的工具,今年下降了25%甚至更多。

表3:使用率跌幅最大的主要分析/数据科学工具。

深度学习工具

调查结果显示,近几年深度学习工具的使用比例保持稳定。今年的调查中有33%的投票者使用深度学习工具中,2017年和2016年的比率分别为32%和18%。

谷歌的TensorFlow仍然是是目前最受欢迎的深度学习平台,不过Keras的使用率也很高,接近TensorFlow。

PyTorch排在第3,使用率为6.4%。不过, KDnuggets 的读者更多是数据科学领域的,这个数据可能不能完全反映这些深度学习工具在研究社区中的真实受欢迎程度。PyTorch在今年有一次较大的升级更新,并且与Caffe 2合并,预计未来它的使用率将会更高。

深度学习工具排名

  • Tensorflow, 29.9%
  • Keras, 22.2%
  • PyTorch, 6.4%
  • Theano, 4.9%
  • Other Deep Learning Tools, 4.9%
  • DeepLearning4J, 3.4%
  • Microsoft Cognitive Toolkit (Prev. CNTK), 3.0%
  • Apache MXnet, 1.5%
  • Caffe, 1.5%
  • Caffe2, 1.2%
  • TFLearn, 1.1%
  • Torch, 1.0%
  • Lasagne, 0.3%

大数据工具:Hadoop的使用率有所下降

今年的调查中,大约33%的投票者使用了大数据工具,要么是Hadoop,要么是Spark——比率大致与2017年相同,但Hadoop的使用率显著下降了——约为30%。

详细结果如下:

编程语言

Python取代R语言成为数据科学/机器学习开发者中最受欢迎的编程语言,而且也远高于其他编程语言。SQL、Java、C/ C++的排名保持不变。

这是自KDnuggets网站开始进行这项调查以来,R的使用率首次下降。其他编程语言的使用率也有所下降。

以下是按受欢迎程度排序的主要编程语言。

  • Python, 65.6% (2017年是59.0%), 11% 上升
  • R, 48.5% (2017年是 56.6%), 14% 下降
  • SQL, 39.6% (2017年是 39.2%), 1% 上升
  • Java, 15.1% (2017年是 15.5%), 3% 下降
  • Unix, shell/awk/gawk, 9.2% (2017年是 10.8%), 15% 下降
  • Other programming and data languages, 6.9%, (2017年是 7.6%), -9% 下降
  • C/C++, 6.8%, (2017年是 7.1%), 3% 下降
  • Scala, 5.9%, (2017年是 8.3%), 29% 下降
  • Perl, 1.0% (2017年是 1.9%), 46% 下降
  • Julia, 0.7% (2017年是 1.2%), 45% 下降
  • Lisp, 0.3% (2017年是 0.4%), -25% 下降
  • Clojure, 0.2% (2017年是 0.3%), -38% 下降
  • F, # 0.1% (2017年是 0.5%), -73% 下降

原文:https://www.kdnuggets.com/2018/05/poll-tools-analytics-data-science-machine-learning-results.html


原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-06-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

演讲 | 亚马逊机器学习总监Alex Smola:为什么你的机器学习代码运行速度慢

机器之心原创 作者:高静宜 2017 年 3 月 27 日,亚马逊云服务(AWS)机器学习总监 Alex Smola 到北京大学招贤纳士,并呈现了一场题为《为什...

3409
来自专栏数据科学与人工智能

【智能】数据科学管道初学者指南

曾几何时,有一个名叫Data的男孩。 在他的一生中,他总是试图了解他的目的是什么。 我有什么价值观? 我可以对这个世界产生什么影响? 数据来自哪里? 看到你和数...

643
来自专栏携程技术中心

干货 | 模型优化不得不思考的几个问题

作者简介 胡淏,美团算法工程师,毕业于哥伦比亚大学。先后在携程、支付宝、美团从事算法开发工作。了解风控、基因、旅游、即时物流相关问题的行业领先算法方案与流程。 ...

2789
来自专栏AI科技评论

如何评价百度刚刚开源的Paddle平台?

百度今天开源了其深度学习平台Paddle,引发了挺多人工智能领域开发者的兴趣,包括一些之前一直在Tensorflow和Caffe上练手的开发者。不过鉴于深度学习...

3414
来自专栏华章科技

独家 | 一文读懂推荐系统知识体系(附学习资料)

推荐系统就是根据用户的历史行为、社交关系、兴趣点、所处上下文环境等信息去判断用户当前需要或感兴趣的物品/服务的一类应用。

1046
来自专栏CSDN技术头条

从原理到策略算法再到架构产品看推荐系统 | 附Spark实践案例

作者 | HCY崇远 01 前言 本文源自于前阵子连续更新的推荐系统系列,前段时间给朋友整理一个关于推荐系统相关的知识教学体系,刚好自身业务中,预计明年初随着业...

49311
来自专栏人工智能头条

如何从0到1开始机器学习?

1534
来自专栏机器之心

谷歌云TPU服务正式全面开放:「AlphaGo背后的芯片」进入商用化

2778
来自专栏AI科技评论

英特尔IDF PPT揭秘: 高性能计算和深度学习发展的趋势

进行深度学习的训练向来不被认为是CPU的强项,但是以CPU研发见长的英特尔并不甘心屈服于这个定位,在过去的几年里,英特尔及其合作伙伴一直在探索用CPU来进行快速...

3134
来自专栏AI科技评论

深度 | 清华大学博士生涂锋斌:设计神经网络硬件架构时,我们在思考些什么?(下)

基于神经网络的人工智能近年取得了突破性进展,正在深刻改变人类的生产和生活方式,是世界各国争相发展的战略制高点。 神经网络作为实现人工智能任务的有效算法之一,已经...

38110

扫码关注云+社区