想学习R语言却不知道如何学习,应该按何种步骤?

问题:

背景金融小硕,想学习R语言却不知道应该如何学习,应该按何种步骤,看哪些书或者视频资料等东西,所以提问这个问题,希望知道学习R语言的一般过程是怎样的,谢谢大家~~ 希望大家可以按以下的内容来回答,如不适合则无视。在每个阶段应该看哪些书,有哪些网络上有的视频资料比较好,应该从事什么样的练习加以巩固。

http://www.zhihu.com/question/21654166

Evan 北京大学 回答:

我当初学习R的时候在网上搜到一些R语言学习路线,我在微信圈,微信公众平台上也见多次,写的确实很详细。但是对一些没有编程经验的童鞋来说,学习的难度还是太大了。后来自己浏览了很多R语言书籍,尝试了一些门槛比较低的书籍。自此,R语言学习才走上正轨。以下涉及内容包括R语言书籍的推荐,以及R语言相关课程的推荐,学完这个教程的内容之后足以应付工作学习中遇到的统计分析的问题了。

经典书籍推荐

R语言有两类书籍比较“坑”,一类是Programming类,一般都带programing字眼,但不绝对。这类书籍一般是计算机背景的人写的,关注的重点是编程(鞋代码和编程不是一码事),底层的运行机制之类的,比较难以捉摸,典型的例子是《The art of R programming》。还有一类是讲统计知识比较多,而且喜欢推公式。虽然有所裨益,但是会分散很多学习R的精力,可以作为后期提高的书籍,但是作为入门不太合适,像《The R book》。

讲完了“不好的”R的学习资料,可以规避一些“误入歧途”的风险。下面介绍一下我觉得比价有用的学习资料。学习任何语言的捷径就是Learn by dirty。这里推荐一个网站,code school的Try R 课程,非常基础,从最基本的语句的赋值到最后的数据框的基本操作,手把手一步一步的教你,然后对你输入的语句,网页会给出判断,如果写错了,还有很详细的解释。网页全部是英文的,英语过了四级的童鞋应该可以应付了。

R的入门书籍,比较好的是Learning R , 中文名是《学习 R》。第一章到第五章的数据的基本入门,必须要细看的,而且要读好几遍的,这是R的最基本的东西,需熟练掌握,多家练习。别觉得看懂就行了,只有自己敲出来运行正确才行。第六章环境和函数这一章建议直接跳过,比较抽象,等回头R学的差不多了,再回头看比较好。大多数人,平时基本不涉及到这一样的内容。第七章 字符串和因子也是很重要的一章,特别是医学领域。第八、九章的循环,量力而行。第八章的内容其实大多数其他编程语言都会涉及。但是在R里面,这些显循环,用的较少。其实主要还是向量化的操作为主,也称隐循环。第九章的隐循环非常有用,是R最精华的东西,就是学习起来有点困难。其主要内容是 apply族函数,包括lapply, sapply, tapply, apply, mapply等。这本书最优秀的地方在于数据的subset部分,各种方法讲的非常详细,也有很多的例子。这也是R语言比较难入门的地方。

《R in Action》 确实一本非常优秀的书籍,我看喝多大神都推荐这么书,我大概学了一遍,确实非常不错。这本书非常好的地方在于围绕具体的问题展开,教你如何利用R进行操作,而且选取的例子也非常具有代表性,所以建议每个例子都要详细研究。但是这本书学习曲线比较陡峭,可能上一章的内容还没有消化,又要开始新的内容了。遇到问题时建议多点耐心,谷歌或者请教别人,把这些知识点掌握了,这是R的基础。

还有一本书,《R cookbook》,这本书是围绕具体的问题进行设置的。所以可以作为一个遇到困难时候的快速翻阅手册,里面特别有用的章节是如何运用apply组函数,上面两本书都讲得不是很详细。

R绘制统计图的功能非常强悍

(你见过这么令人心神荡漾的图嘛!)

你见过的没见过,想到的,没想到的,都可以绘制出来哦。哈哈,心动不如行动,几行代码一敲,令人心神荡漾的图片就出来啦。R绘图非常简单的,就是一个简单的学习记忆的过程。R语言绘图发展的非常快现在有三大绘图系统,基础绘图系统,Lattice绘图系统,ggplot2绘图系统。虽然各有其使用价值,但个人推荐ggplot2绘图系统以及基础绘图系统。 Lattice对于多分组的数据的展现比较好,但是ggplot2是可以很大程度上替代其功能,不学习也可以,非要用的时候依葫芦画瓢就可以了。

下面主要介绍R的基础绘图系统和ggplot2绘图系统的学习路线。R基础绘图系统《R in Action》中,花了很大的篇幅介绍了基础绘图系统,如果学习完了,工作中碰到的很多统计图就可以胜任了。如果你喜欢钻研,可以看看谢益辉(Knitr包的作者)的《现代统计图形》,讲的非常详细和透彻。不仅如此,更是讲解了图形的选择,图形的设计方面的知识。学有余力,不妨学习一下ggplot2绘图系统, 推荐《R graphics cookbook》一书。书中不仅有ggplot2的绘图代码而且还将其与基础绘图系统进行了比较。介绍的图形非常实用,而且ggplot2的扩展性非常强,可以发挥你的想象力,创造一些新奇的图形。

R语言书籍全家福

R语言学习网络课程推荐:

1. Datacamp,learn by coding类型的网站,课程设置非常用心,难度合适,内容丰富,最好的R语言学习网站之一。

2. 国内的视频课程

国内的R语言网络课程最丰富的应该是炼数成金(dataguru)平台,课程包括《R语言数据分析、展现与实例》,《R七种武器之交互化展示包shiny》,《R七种武器之文本挖掘包tm》,《R七种武器之数据可视化包ggplot2》、《R七种武器之数据加工厂plyr》、《R七种武器之金融数据分析quantmod》、《R七种武器之网络爬虫RCurl(第四期)》等。其中比较适合入门的课程是 《R语言数据分析、展现与实例》

3. MOOC课程

Coursera John Hopkins 专题课程不错;还有edX上MIT的The Analytic Edge课程也不错。

4. 强烈推荐Swirl包,你值得拥有。

其实相对于常见的编程语言,R语言还是非常容易上手,并不需要很多年的编程经验。而且可以在数据分析领域大展身手。有问题可以在本公众号 留言。

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-05-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据和云

青铜到王者:AIOps 平台在腾讯的升级之路

提起腾讯的运维团队,第一个让人联想起来的名词当属“海量”,早在2004年腾讯前 CTO 张志东先生就提出了一套技术运营的方法论“海量运营之道”。

1336
来自专栏全栈工程师成长之路

程序员最佳学习方法(干货总结)

1887
来自专栏ATYUN订阅号

谷歌采用神经网络驱动机器翻译,可离线翻译59种语言

谷歌的在线翻译自2016年以来一直由神经机器翻译(NMT)驱动,今天,该公司推出了其神经网络驱动的方法,以便谷歌翻译的iOS和安卓应用用户能够更准确地实现59种...

1062
来自专栏大数据文摘

抛掉幻想,谈谈现实中的数据科学家

1493
来自专栏DevOps时代的专栏

衡量:DevOps 架构下的人工智能思维

1446
来自专栏ThoughtWorks

一个AR Tech Radar的诞生

技术雷达是ThoughtWorks每年出品两期的技术趋势报告,一般来说大家看到的雷达都是文档形式,其中有一张技术全景图,以及每个技术点的成熟度分析。而AR技术雷...

931
来自专栏大数据文摘

VR实战 | 最全设计手册(附大量资料、视频)

2596
来自专栏PPV课数据科学社区

【学习】一文读懂R语言 R可以做所有SAS做的事情

以下5种语言NODE、LUA、Python、Ruby、R ,哪个在2014年的应用前景会更好? 我毫不犹豫的选择R。R不仅是2014...

2795
来自专栏养码场

7个实战案例、24个学习视频、12G干货资料...今天带你免费入门Python数据分析!

你花了大半天整合了一张数据表,却因为其他部门的错误,导致表格结构全错了!于是你又要吭哧吭哧重新来过...

1811
来自专栏织云平台团队的专栏

青铜到王者:AIOps 平台在腾讯的升级之路

在海量运营方法论的指导下,运维团队构建了体系化的运维能力,为众多产品保驾护航。

4.2K11

扫码关注云+社区