R语言什么鬼??你知道吗?

R语言什么鬼?可以用来做什么?和大数据又有什么关系?有没有好的课程推荐啊?学大数据一定要懂R语言么?…… 网络上太多类似的问题,如果恰好你也有类似的疑惑,那么希望阅读本文之后你不再困惑~

〓R语言简介:

R是一套完整的数据处理、计算和制图软件系统。

其功能包括:

  • 数据存储和处理系统;
  • 数组运算工具(其向量、矩阵运算方面功能尤其强大);
  • 完整连贯的统计分析工具;
  • 优秀的统计制图功能;
  • 简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。

与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。

R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截至2013年3月6日,CRAN已经收录了各类包4338个。例如用于经济计量、财经分析、人文科学研究以及人工智能。

R的思想是:

它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。

〓R语言可以用来做什么?

1、R主要擅长统计分析方面工作

R最初是由两位统计学家开发的,其主要优势也在于统计分析方面。它提供了各种各样的数据处理和分析技术,几乎任何数据分析过程都可以在R中完成。

与此相比较,SPSS、MINITAB、MATLAB等数据分析软件更加适合于已经处理好的、规范的数据,而对于还未完成处理过程,或者在分析中仍需大量与处理过程的数据而言,它们可能会显得繁琐一些。

2、R具有顶尖的绘图功能

尤其对于复杂数据的可视化问题,R的优势更加明显。

  • 一方面,R中各种绘图函数和绘图参数的综合使用,可以得到各式各样的图形结果,无论对于常用的直方图、饼图、条形图等,还是复杂的组合图、地图、热图、动画,以及自己脑子里突然想到的其他图形展现方式,都可以采用R语言实现。
  • 另一方面,从数值计算到得到图形结果的过程灵活,一旦程序写好后,如果需要修改数据或者调整图形,只需要修改几个参数或者直接替换原始数据即可,不用重复劳动。这对需要绘制大量同类图形的用户比较适用。

例如,某用户需要观察某一因素与其他100个因素的交互关系,可以绘制100个条形图或走势图。配合R的循环和条形图功能,可以很快得到jpg、png、bmp、tiff、gif或postscript等格式的图形结果。

3、R的交互式数据分析功能强大且灵活

一个完整的数据分析过程可以大体包括以下几个步骤:

(1)导入数据; (2)数据准备、探索和清洗; (3)拟合一个统计模型; (4)得到结果并进行评估; (5)如果结果的评估不理想,重新完成(3)步骤; (6)得到多个模型的结果,并进行交叉检验; (7)根据模型结果进行预测、分析等; (8)形成报告。

R中每个步骤的所有“输出”都可以直接作为下一个步骤的“输入”,可以批量完成以上所有的(8)个步骤。

这个优点主要与STATA、SPSS等统计软件相比而言的,STATA和SPSS的统计分析结果是一大串图表或统计量。如果只是一个或少数几个步骤的分析,这种出现一大串结果的批处理更加直观方便。但如果分析中涉及很多连串的模型,而且一些模型需要反复调用前面模型的结果,那么R的灵活性会更加凸显。

4、R可以轻松地从多个数据源导入数据

包括文本文件、数据库、其他统计软件等。这一点很多其他软件还难以做到。

如readLines()、read.table()等函数可以导入文本数据,foreign包的read.spss()可以导入SPSS软件的sav格式数据,foreign包的read.dta()可以导入STATA软件的dta格式数据等等。

其他有关数据导入导出的函数可以参见R帮助文档《R Data Import/Export》。

〓R语言与大数据的关系

如果你对于R语言和大数据之间的关系不是太清楚,或者你有着“学大数据一定要懂R语言吗?”这样的疑惑,那么希望下图可以给你一下参考:

〓R语言课程

如果你想学R语言,可以通过以下基础课程来掌握,利用项目实战课程来了解R语言的用途以及使用方法。

基础入门:

  • 【R语言入门】视频课程

R语言实战:

  • 【R语言实战】 时间:4天现场+40节视频 授课方式:现场 +视频 授课地点:深圳 本课程结合大量的案例,让学习者可以快速掌握数据分析技能,并利用R实现各种数据挖掘模型的建立。 培训介绍:http://www.ppvke.com/class/detailcontent/?hid=340&tid=100074

项目实战:

  • 【R语言数据挖掘实战】 时间:18天 4天理论、4天工具(R)、10天案例 授课方式:现场 授课地点:广州 课程偏重于从基础到实践,通过案例分析了解各个工具的应用,数据分析流程,数据挖掘流程,建模等等。适合于积累项目经验,便于就业快速上手。 培训介绍:http://www.ppvke.com/Answer/?/page/rencaijihua

课程咨询 与报名方式:

QQ:800098648

电话:400-070-7620

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

本文分享自微信公众号 - PPV课数据科学社区(ppvke123)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-09-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【学习】笨办法学R编程(四)

随着教程推进,基本的语法都接触得差不多了。当要解决某个具体问题时,只需要考虑用什么样的算法来整合运用这些函数和表达式。今天来解决Project ...

29440
来自专栏PPV课数据科学社区

为什么Python如此适合AI和机器学习?5位Python专家告诉你

摘要:Python是机器学习最好的编程语言之一,和R语言一样,很快将会成为学术和研究领域统治者。但为什么Python在机器学习领域如此受欢迎? Mike Dri...

41460
来自专栏PPV课数据科学社区

【学习】笨办法学R编程(三)

看到各位对“笨办法系列”的东西还比较感兴趣,我也很乐意继续写下去。今天的示例将会用到数据框(data.frame)这种数据类型,并学习如何组合计算...

38050
来自专栏PPV课数据科学社区

R语言和 Python —— 一个错误的分裂

最近有一些文章提出与年龄相关的问题:“崭露头角的年轻数据科学家们是学习R语言还是Python更好?” 答案似乎都是“视情况而定”,在现实中没有必要在R和Pyt...

412110
来自专栏PPV课数据科学社区

【学习】笨办法学R编程(一)

在倚天屠龙记中,有一人唤作火工头陀。此人练功不靠心法,只靠模仿他人招式,由外而内,自成一家。练习编程也有如此的法门,不看文字描述,只观察和模仿别人...

36450
来自专栏PPV课数据科学社区

【学习】一文读懂R语言 R可以做所有SAS做的事情

以下5种语言NODE、LUA、Python、Ruby、R ,哪个在2014年的应用前景会更好? 我毫不犹豫的选择R。R不仅是2014...

31150
来自专栏大数据钻研

历史上最伟大的12位程序员

所谓程序员,是指那些能够创造、编写计算机程序的人。不论一个人是什么样的程序员,或多或少,他都在为我们这个社会贡献着什么东西。然而,有些程序员的贡献却超过了一个普...

392110
来自专栏PPV课数据科学社区

【观点】R语言如何发展?商业支持或许可行

摘要:Revolution Analytics已经提供了一个商业级R语言发行版Revolution R Enterprise,作为一个用于统计分析和基于数据图...

26750
来自专栏PPV课数据科学社区

【学习】《R实战》读书笔记(第二章)

“读书会是一种在于拓展视野、宏观思维、知识交流、提升生活的活动。PPV课R语言读书会以“学习、分享、进步”为宗旨,通过成员协作完成R语言专业书籍的精读和分享,达...

37590
来自专栏PPV课数据科学社区

译文:朴素贝叶斯算法简介(Python和R中的代码)

朴素贝叶斯是一种用于分类问题的机器学习算法。它是基于贝叶斯概率定理的。主要用于涉及高维训练数据集的文本分类。几个相关的例子有:垃圾邮件过滤、情感分析和新闻文章...

44150

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励