开发 | Python赶超R语言,成为数据科学、机器学习平台中最热门语言?

AI科技评论消息,近日,kdnuggets做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了954个回答,得出结论——Python已经打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。有关此次问卷更具体的情况如何?AI科技评论将kdnuggets上发表的总结文编译整理如下:

之前我们在kdnuggets上做了这样一个问卷调查,2016、2017两年,在分析、数据科学和机器学习的工作中,你用R语言,还是Python,或两者都用,或选择其他的语言?

通过分析954个回答,我们得出了这样的结论:虽然Python并没有完全取代R语言,但在2017年,Python已经成功打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。

在2016年Python还是第二位(主要用Python的人占34%,主要用R语言的人占42%),在2017年Python就以5%的优势领先于R语言(主要用Python的人占41%,主要用R语言的人占36%)。同时用Python和R两种语言的人也从2016年的8.5%增长到12%了,而用其他语言的人则从16%降到11%。

图1:2016-2017年,在分析、数据科学和机器学习中使用Python、R语言、Python和R语言、其他语言的占比

之后,我们分析了大家在不同语言之间的转换情况。

图2:2016-2017年,分析、数据科学以及机器学习平台中各种语言的转换情况

这张图看起来很复杂,不过从中可以很容易地看出Python在忠诚度和转换率两个关键层面都领先于其他语言。

  • 忠诚度:使用Python的用户对它的忠诚度要高于使用其他语言的用户。2016年使用Python的用户中,有91%的人2017年还在继续使用它,而R语言的用户留存率为74%,其他语言的用户留存率则为60%。
  • 转换率:从2016年到2017年,只有5%的Python用户转向R语言,而R语言用户转向Python的则是10%,这是前者的两倍。另外,2016年同时使用两种语言的人中,只有49%的人还在继续使用这两种语言,38%的人转向Python,11%的人转向R语言。

接下来我们看一下2014-2017年这几种语言的使用趋势。

因为我们2015年【R vs Python】的问卷调查中没有提供【同时使用两种语言】这个选项,因此下面2014-2016这四年的对比趋势图中,2016、2017年的Python、R语言使用趋势我们是这样计算的:

Python*= (Python的比例) + 50% * (同时使用Python和R语言的比例)

R* = (R的比例) + 50% * (同时使用Python和R语言的比例)

可以看到,R语言的使用率在逐年缓慢下降(从2015年的50%降到2017年的36%),而Python的使用率则从2014年的23%增长到2017年的47%。另外,其他语言的使用率也在逐年下降。

图3:2014-2017年,Python、R语言及其他语言在分析、数据科学和机器学习的使用情况对比

最后,我们也按地区分析了几种语言的使用趋势,地区分布情况如下:

  • 美国/加拿大,40%
  • 欧洲,35%
  • 亚洲,12.5%
  • 拉美,6.2%
  • 非洲/中东,3.6%
  • 澳洲/新西兰,3.1%

为了简化对比图,我们将同时使用R语言和Python的比例也按照上面的计算方法折算到单独使用R语言和Python的比例中,并把亚洲、澳洲/新西兰、拉美、非洲/中东这四个占比较少的地区合并为一个区域。

图4:2016-2017年,不同地区使用Python、R语言和其他语言的情况

我们注意到不同区域的语言变化情况:

  • Python的使用率增长了8-10%
  • R语言的使用率降低了大约2-4%
  • 其他语言的使用率降低了5-7%

上面的数据表明了Python的使用前景很好,我们也预测R语言和其他语言的使用率还是会有相当的占比,因为它们已经有很深的用户基础。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-09-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏BestSDK

4个要点,让你掌握数据创业的精髓

首先,我们需要明确一个概念:什么是数据科学家? 一般的定义是:能够采用科学方法、运用数据挖掘工具对复杂多量的信息进行数字化重现与认识,并能从中找出新的数据洞察的...

2727
来自专栏TAPD

首度揭秘:腾讯敏捷研发和极速交付破局之道

 导读  腾讯到底是怎么进行敏捷研发和极速产品交付的呢? 腾讯研发管理部高级产品经理、敏捷教练张贺,受邀在DevOpsDays深圳站中进行了相关分享。 他从“...

984
来自专栏PPV课数据科学社区

大数据的痛点

大数据分析仍处于初级阶段,我们还没有深入应用数据驱动决策。在这里,我们讲讨论当前的痛点以及如何用更好的方式应用大数据。 大数据为企业提供了一个更好的提高生产力和...

4216
来自专栏AI科技大本营的专栏

苹果Siri团队被合并,由谷歌前高管直接领导

7 月 11 日消息,据国外媒体 TechCrunch 报道,苹果公司正在创建一个新的 AI/ML(人工智能/机器学习) 团队。该团队将整合苹果之前的 Siri...

892
来自专栏AI研习社

Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

近日,kdnuggets 做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了 954 个回答,得出结论——Python 已经打败 R 语言,成为分...

2967
来自专栏腾讯高校合作

微信今日正式上线智能开放平台

微信今日正式上线智能开放平台。语音识别和图像识别成为首批开放给第三方应用开发者的智能识别技术。 通过调用相关技术接口,第三方应用也可以实现微信中已有的语音转文字...

3245
来自专栏镁客网

爆料称亚马逊将发布新设备,与自家投资的智能家庭对讲机公司对打

1183
来自专栏人称T客

报告丨云分析可以提升28%的客户满意,9%的客户留存和13%的营收

T客汇官网:tikehui.com 译者 | 飞逸 随着大数据和云计算的流行,云分析也开始在市场中展露了头角。2017年二月,Garnter在其商业智能分析平台...

2877
来自专栏技术与生活

运营是什么——《运营之光》读书笔记

所以,一个真正意义上的“产品运营”,其实是一个综合能力比较均衡,既熟悉各类运营手段,又熟悉产品,甚至能够自己完成一些产品方案的人。

2632
来自专栏AI研习社

对创业公司的忠告:这么玩数据才不会死

编者注:本文作者 Matthew Coffman,是专注于企业云的风投基金 High Alpha 产品经理。他具有丰富的大数据行业经验,也参与和见证了许多数据公...

3236

扫码关注云+社区