今天给大家介绍一款在开源世界里集万千宠爱于一身的软件——R语言。
有多受宠呢?简单说,你能想到的地方都有它的身影。
做学术?看看R在各大语言排名系统的表现
O' reilly media在过去几年中进行了一系列数据科学调查,分析了数据科学趋势。在2016年的调查报告中,R语言是最常用的编程语言(如果排除SQL的话,在本文中它不能称为编程语言)。57%的调查人群使用R语言(使用Python的比例为54%)。
此外还有TIOBE指数(按搜索引擎搜索次数对编程语言进行排名)。在TIOBE指数上,R语言十年来呈现出稳定上升趋势。
找工作?看看使用R语言的公司
在招聘数据科学家的几家顶级公司中,R语言使用程度非常高。诸如国外的Google和Facebook 、Microsoft,国内腾讯、京东、微软等公司都有使用R语言数据科学家。R语言的市场招聘需求也非常旺盛。(以下为猎聘网搜索结果)
听讲座?看看每年举行R大会的阵容
2017年,是中国R会议值得纪念的第十个年头。
卖了这么久关子,那么R到底是个啥?我们为什么要用它呢?且听我慢慢道来。
R语言是什么?
这个问题相信不用我多说了,简单粗暴的说:R 是一个有着统计分析功能及强大作图功能的软件系统。我们一般使用R-Studio作为它的编辑环境。
认识一种语言,我们要从它的历史说起。
那就得先从另一款语言S谈起,(嗨不是你们脑海里的大S,小S啦!)S语言是由 AT&T贝尔实验室John Chambers等人开发的一种用来统计编程的语言。S语言目前有两种实现版本,一种是现在由TIBCO经营的商业软件 S-plus, 另一种就是免费开源的R语言。
1992年,Auckland大学的Robert Gentleman 和 Ross Ihaka 为了能够更有效地开展大学里的统计入门课程的教学,他俩决定引入S语言来开发一套软件,1994年该软件最初版本基本成型。这就是后来我们用到的R的雏形啦。
(对,这就是它的爸爸们啦,这下知道我们的明星语言为什么要姓R了吧)
为什么要使用R语言?
1. 物美价廉——作图颜值高,且完全免费
说它物美,主要是指它卓越的作图功能。
可以说,点图线图柱状图直方图,R语言样样精通,而且设计感满满,绝对可以在这个看脸的世界里独挡一面。比如你可以画这样的图:
如果对R中基本图形稍作修饰,你还能画成这样:
还能这样(上海地区工商银行分布核密度图):
2. 兼收并蓄——算法覆盖广,扩展易
作为统计分析工具,它几乎覆盖整个统计领域的前沿算法。
从火到根本停不下来的的神经网络(就是那只下围棋的机器狗脑袋里的东西),到经典了一百多年还熠熠生辉的基础回归,数千个R包,上万种算法,你都能找到可直接调用的函数实现。
3. 软件扩展易
作为一款软件系统,它有极方便的扩展性。你的数据原来存在Oracle 里?没问题,轻松导入;你的数据在MySQL 里?没问题, 照样解决。文本文件、数据库管理系统,统计软件,专门的数据仓库都可兼容。它同样可以将数据输出并写入到这些系统中。
同时它还可以轻松于各种语言完成互调,比如大数据系统Hadoop,商业软件SPSS、SPSS Modeler,你曾经爱的python,都可无缝对接。
4. 集千万力量于一身——强大的社区支持
作为一个开源软件,R背后有一个强大的社区和大量的开放源码支持,获取帮助非常容易。
比如国外比较活跃的社区有GitHub和 Stack Overflow等,通常R包的开发者会先将代码放到GitHub,接受世界各地的使用者提出问题,修改代码等操作,等代码成熟后再放到CRAN上发布;
而Stack Overflow 则是一个优质的IT技术问答网站,当你在Google上搜索R问题时,通常会看到该网站的回答会排在首位,足可见该网站的搜索热度有多高!
而国内如经管之家论坛-五区 【R语言论坛】等都是优秀的R语言社区。
R还有什么神奇的技能?
知乎一名用户的回答,我觉得挺有意思。
男票也喜欢R,于是有一天,他忽然屁颠屁颠跑来告诉我, 宝宝你知不知道R里面有一个package,会不停的夸你^o^
我0.0
这个package叫praise, 于是就是 >>>praise( ) you are awesome >>>praise( ) you are outstanding
R还能充当PS,开发小游戏,总之,更多的精彩等你来发掘!
R是一种用于分析数据的领域特定语言。如果你之前未接触过专业的分析软件,那么R是不错的选择。