有奖转发活动
回复“抽奖”参与《2015年数据分析/数据挖掘工具大调查》有奖活动。
何品言翻译,广东科技学院大学生,喜欢R语言和数据科学。王陆勤审核,从事数据挖掘工作,专注机器学习研究与应用。英文链接:http://www.r-bloggers.com/how-to-learn-r-2/PPV课原创翻译文章,转载请注明以上信息及原文链接! |
---|
这里有无数的资源可以帮助你从不同的方面学R,然而对于初学者的你来说可能会觉得这样让你感到吃不消。而且R又是一门动态语言,它时刻都在变化,所以我们需要时常更新我们的工具以及技术到最新的版本。
这就是为什么R-bloggers和DataCamp合作要写一篇文章来给你怎样开始学习R提供可靠的建议。这篇文章中,每个部分都会介绍不同的并与这个部分相关的资源以及工具,它们可以帮助你入门R并帮助你保持持续的学习动力。这里的材料由文档、网络资源、书籍以及更多的资源混合而成。
就像R那样,学习路线图是一个动态的资源。我们想要持续的发展和改善这些资源而且尽可能的给您提供最好的学习路线图。如果你有什么建议的话,欢迎把你的反馈发到 tal.galili@gmail.com这个邮箱中。
学习路线
入门:R的基本知识
准备好你的机器
R包
把你的数据输入到R中
数据操作
数据可视化
R的数据科学和机器学习
报告相关结果
下一步
入门:R的基本知识
学习R最好的方法就是实践。如果你只是刚刚接触R,由DataCamp相关人员编写的 free introduction to R tutorial(R的免费入门教程)就是一本很好的教材以及后续要看的Intermediate R programming (R程序设计,里面提供相关脚本)。这些教材都教你如何进行R编程以及互动式学习数据科学,而且你可以按照你自己的方式学习和浏览相关信息。在你做学习过程中,一旦提出了你不懂的问题,你就能马上得到相关的提示,而且都很有用。
另一个R的网上互动式学习教材就是O’reilly代码学校网站,名叫Try R,你可以从这里获取相关资源。而比较好的一个线下学习资源是swirl,一个R包,能让你快乐学习并且可以在短时间内掌握R编程。你可以通过下载相关R包进行swirl的相关课程,同时可以从课程库中选择你需要的课程进行学习。如果你想在入门的时候不想下载任何东西,你也可以选择网络版的swirl课程。
在edX和Coursea这里也有一些很好的在线学习平台教你怎样学习R的基本知识。在edX你可以找一些微软的Introduction to R Programming(R编程导论),这是一门8小时的课程,它主要讲了R最基本的内容已经R的基本语法。在Coursea,你可以找一下 R Programming course by Johns Hopkins,这门课程很热捧。这两门课程都是重点推荐的。
推荐PPV课上面的R语言系列课程:R语言入门、R语言实战、机器学习与R语言实战,
如果你想通过阅读纸质版的教材来学习R或教程,这里也有很多的选择。这里有 introduction to R manual by CRAN(CRAN的R手册导论),同时还有Jared Lander写的R for everyone(每个人的R)或者Robert Kabacoff写的R in action(R语言实战)。
准备好你的机器
你可以从Comprehensive R archive Network(CRAN)那里下载R的安装包。这里有适合Windows、Linux和Mac的二进制安装包。
一旦完成安装R,你可以选择R的控制台环境,或者集成开发环境(IDE)。RStudio是目前为止R集成开发环境中最受欢迎的,同时还支持脚本的调试、工作空间的管理、作图和更多其它功能(你要检查一下你的RStudio菜单栏)。
接下来,RStudio也在R的集成开发环境中给你提供了相关的架构和开发工具。如果你希望能进行图形界面操作,你可以查阅一下R-commander或者Deducer。
R包
R包是推动R的发展和规模扩大的动力,而R包则由一串代码、数据、文档以及易于分析到其它地方的测试组合而成。在你使用R包以前,你需要安装相关的R包。一些R包,诸如基本的R包,会在你安装R的时候自动帮你安装好的。其它的R包,如ggplot2这样的包,不会自动帮你装好,需要你手动安装它们。
很多的R包都已经在CRAN,一个其服务端遍布全世界各地,并且全世界是对R的代码和文档进行同步更新和储存的网络进行过整理并且可以从CRAN那里得到它们。你可以通过编写install.packages脚本轻松的从R内部下载这些包。CRAN也运行了一个任务预览集,它可以确认所有的R包都与其相对的特定任务的联系,就像时间序列那样。
你也有bioconductor,它提供了用于分析高流量的基因序列数的包;同样的,例如github和bitbucket库里的R包开发者。你可以通过使用devtools包轻松从这些库下载相关R包。
寻找R包是困难的,但幸运的是,你可以轻易的从CRAN,github和bioconductor(从R内部使用R文档)中下载相关R包,或者你可以查阅一下有用的R包这个快速列表。
最后,一旦你开始了进行R相关操作,你很快会发现R包之间的依赖关系会导致很多很头疼的问题。一旦面对这样的情况,确认一下packrat(查看录像课程)或者checkpoint。当你需要更新R包的时候,如果你用的是windows操作系统,你可以从installr包中使用updateR()函数。
对R进行数据导入
你可以在R中导入一下所有形式的数据文档:普通形式文件、统计软件文件、数据库和网络数据。
为了能把不同类型的数据导入到R中,你通常需要各种方法来实现它们。如果要学习在一般情况下怎样把各种类型的数据导入到R的话,你可以查阅一下online data Importing into R tutorial(在线把数据导入到R教材)这本教材,而这篇文章会提到RSstudio中的数据导入和相关网络研讨会。
1、回复“数据分析师”查看数据分析师系列文章
2、回复“案例”查看大数据案例系列文章
3、回复“征信”查看相关征信的系列文章
4、回复“可视化”查看可视化专题系列文章
5、回复“SPPS”查看SPSS系列文章
6、回复“答案”查看hadoop面试题题目及答案
7、回复“爱情”查看大数据与爱情的故事
8、回复“笑话”查看大数据系列笑话
9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载
PPV课大数据ID: ppvke123 (长按可复制)
本公众号专注大数据和数据科学领域,分享领域知识和相关技术文章,探索大数据商业价值,培养和挖掘大数据专业人才,欢迎大家关注!