首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python 在将 R 绞杀至死吗?

就编程语言而言,Python炙手可热,这点毋容置疑。Python起初是一种通用脚本语言,后来逐渐成为数据科学界最流行的语言。但Python是以牺牲R而成名的吗?据IT行业的一些人士认为,答案是肯定的;他们称,R这种语言寿终正寝。

有证据表明Python的受欢迎程度在影响R的使用率。据TIOBE指数排行榜显示,Python目前是世界上受欢迎程度排第三位的语言,仅次于常年的两大热门语言Java和C:从2018年8月到2019年8月,Python的使用率增幅超过3%,达到10%的评级(TIOBE主要衡量搜索活动的专有标准),一举成为20种受欢迎程度最高的语言中势头最猛的语言。

相比之下,R最近在TIOBE指数排行榜上表现不佳,它从2018年1月的第8位跌到了今天的第20位,受欢迎程度不如Perl、Swift和Go等语言。在2018年1月达到顶峰时,R的受欢迎程度评级为约2.6%。但是据TIOBE指数排行榜显示,今天它跌至0.8%。

TIOBE指数排行榜的制作人员在7月份写道:“Python的受欢迎程度持续增长,而相比之下其他编程语言的受欢迎程度因此下跌。R就是其中一种编程语言,Perl受到的影响更大。”

据TIOBE指数排行榜显示,R最受欢迎的时候出现在2018年1月:

这导致一些专家宣称R已奄奄一息。Dice Insights是一份与知名的技术行业薪资网站Dice有关的在线出版物,在7月份的文章中称R是“可能注定失败”的五种语言之一。

Dice Insights的资深编辑Nick Kolakowski写道:“虽然R仍被学界人士和数据科学家所使用,但对数据分析感兴趣的公司正纷纷转向Python,冲其可扩展性和易用性而去。”他写道,依赖“一小撮学界人士及其他无足轻重的人”使用可能不足以让R活下来。

其他数据表明,Python这些年来的成功是以牺牲R和SAS(流行的专有分析环境)为代价的。作为薪资调查的一部分,Burtch Works一直在向数据科学家和分析师询问他们青睐哪种环境:R、Python还是SAS。

2014年和2015年,SAS仍占主导地位,但R迅速受到追捧。然而从2016年到2018年,Python异军突起。2018年,Burth Works声称Python、R和SAS出现了三足鼎立之势。其他民意调查表明了类似的动向。

Python显然势不可挡,但DataCamp的联合创始人Martijn Theuwissen拒绝承认R已死或将死。他说:“声称R没落的说法夸大其词。如果你看一下R的发展,它仍呈发展的势头。从我观察的情况来看,Python发展势头更猛。”

Theuwissen于2013年与Dieter De Mesmaeker和Jonathan Cornelissen共同创办DataCamp时,公众对R的兴趣激增。实际上,R是DataCamp关注的焦点,DataCamp提供数据科学、数据分析和机器学习等方面的教育和培训。从那以后,公众对Python的兴趣呈井喷之势,今天除了Scala和SQL方面的课程外,DataCamp还提供Python和R方面的课程。

据Burtch Works针对首选建模环境的调查显示,Python、R和SAS在2018年难分胜负:

Theuwissen说:“我们在六年前创办公司时,面向数据科学的R大幅增长。我们很少听到Python。但两年后[2015年],我们听到Python越来越多地应用于数据科学。”

试图衡量语言的受欢迎程度是一项异常困难的任务。虽然语言确实有其生命力,但没有万无一失的方法可以确定它们在任何一个时间点处于生命周期的哪个阶段。当然,没有办法以百分之百的把握来预测未来。

当Guido van Rossum早在20世纪80年代首次提出Python时,其目的不是创建世界上最流行的数据科学语言。谁会预测到Python后来大器晚成、成为数据科学和机器学习领域的通用语言?

与Python相比,R被认为是面向统计计算的语言。从20世纪90年代初一开始,R的两位开发者:奥克兰大学的Ross Ihaka和Robert Gentlemen寻求一种方法,结合S的结构和良好的用户界面,以便学界人士、工程师及其他人可以建立统计模型并分析数据。

Ihaka在1998年的论文《R:过去和未来历史》中写道“我们在自己的Macintosh教学实验室中既对统计计算感兴趣,又看到普遍需要一种更好的软件环境。我们发现没有合适的商业环境,于是开始尝试看看是不是可以自行开发一个合适的环境 。”

在过去三十年里,R早已扩大到新西兰之外的地区。据R Consortium这个致力于推广使用这种开源语言的组织声称,目前全球使用R的用户已超过200万。开发人员通过CRAN编写并开源了13000多个库,以便自动执行各种统计任务和图形绘制。

R Consortium在其网站上表示:“众多组织已采用R语言作为数据科学平台,包括生物技术、金融、研究和高科技行业。R语言常常集成到第三方分析、可视化和报告等应用环境中,在众多计算平台上运行。”

R的一个好处是,它在大学和学院当中广泛教授。许多在多门学科攻读科学学位的研究生学习R用于统计建模。随着对数据科学家的需求不断增长,“硬”科学方面受过训练的这些人中许多将他们的统计能力运用于新的数据科学行业,随之带来了R知识。

Python也在高等院校中予以教授,但它更常出现在计算机科学系,而不是天文学系或野生动物生物学系。随着这些大学毕业生走上工作岗位、成为软件工程师,Python成了他们偏爱的语言之一。当这些人转而进入数据科学岗位时,他们更倚重Python再自然不过了。

在一则题为“R是否进入死胡同?”的Reddit讨论中,许多人全面比较了R与Python的诸多技术优势。一个反复出现的主题是,虽然用户运用R或其中一个库也许能够直接完成几乎任何统计任务,但是有人担心这种语言根本跟不上Python,在Web浏览器中运行时更是如此。(R的可扩展性存在明显的限制是R抨击者当中经常提到的另一个主题。)

一些Reddit用户写道,另一方面,Python从广泛可用的Numpy等统计库受益匪浅,在浏览器中使用时如鱼得水。Python很容易在数据科学笔记本(比如iPython和Jupyter)中用于建模。虽然R也可以在像Jupyter这样的数据科学笔记本中使用,但Python是默认模式。

DataCamp的Theuwissen表示,Python生态系统正赶超R生态系统。自从微软在2015年收购Revolution Analytics以来,专注于R的数据科学和分析软件供应商的数量在缩减。

他说:“除了R Studi外,我认为没有大公司在推动这种语言发展。至于Python,很多人在为这个生态系统做贡献。”

除了发布名为Microsoft R Open的开放版本外,微软仍然开发并支持它通过Revolution Analytics交易获得的R软件。然而,核心的R产品不再有R这个名称,而Python正是原因所在。微软上个月在一篇博文中写道:“该产品已从R Server改名为Machine Learning Server,以体现新增基于Python的分析产品这一事实。”

数据科学领域庞大而繁杂。虽然它在过去几年明确表明看好Python,但这并没有削弱人们对其他语言的贡献或个人在其他环境中做好工作的潜力。

眼下这个特定时期,Python的前途可能比R来得光明,但并不意味着R就没有前途。Python对一些数据科学工作来说可能是最佳工具,但对其他工作而言,R很难击败。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190819A0QZOL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券