分享 | 一个文科生学习R语言是种怎么样的体验?

首先介绍一下本人的相关情况:本人毕业于不入流的大学,专业是英语。数学水平在高中水平,因为大学文科专业不需要学习高数等课程,以前以为这是很大的好处,但是现在觉得这是一个非常大的遗憾。

计算机水平也不高,但是属于比较喜欢倒腾的,编程的话,只是在工作中使用一些相对比较简单的VBA。

其实在我入职现在的公司之前,我对统计是一无所知的。但是入职以后恰巧我们公司在全球范围内实施Six Sigma Program,如果大家对制造业有所了解的话,对这个也不陌生。Six Sigma的培训课程中有一些基本的统计知识的应用,那些东西对于当时的我而言无异于天书,为了能够把握这个机会,因而奋力学习统计知识,几乎将网上能够买到的统计和数据分析的书都买遍了,也就是从那个时间起,我成了人大经济论坛的常客。在人大经济论坛上,我的收获也是很大的,在此对论坛上无私分享的高手们表示感谢!

好了,以上就是我的相关情况,其实概括起来就很简单了,就是一个典型的热爱数据分析的文科男。

下面回到正题,关于我学习R的情况:

首先,我一开始只使用与Six Sigma相关的软件,Minitab,这个是一个界面化的统计软件,相对而言比较小众,但是比较容易上手,更重要的是有一些与Six Sigma相结合的工具,这是一个很大的优势,但是它在更复杂的数据分析方面就比较吃力了。同时,也开始接触到工作中一些比较复杂的数据分析问题,另外,自己的数据分析的知识也在不停地增长,掌握的方法也逐渐多了起来,也越来越感觉到Minitab的局限性,虽然它也在不断升级。

那么,下面可以考虑的软件就是SPSS,SAS等商业化软件,这个对我来说是不可行的,因为这些软件不在公司的标配软件清单里面,加上美国人的版权意识,公司的电脑不可以装盗版等原因,就没有办法考虑这些软件了。

这样看下来,能考虑的就只有Python和R了,我是花了很长时间才决定了使用R的,因为在论坛里面查找相关讨论,我的理解就是,如果你有比较好的编程基础,想搞数据分析,从Python入手比较好,如果你本身比较侧重数据分析,那可能R更好,两者的比较,论坛里有很多很好的资料,在此不多说了。

一开始学习R,我的反思是我还是走了一些弯路的,一开始看的资料有点过难了,走了弯路,直到最近总结了一下,我觉得合理的路径应该这样的:

首先介绍给大家的第一本书是R for Dummies,Dummies系列,可以说是家喻户晓。我一开始并没有看这本书,直到不久前才看,我个人的体会是,我们这样的编程门外汉在学习编程的时候,往往是被一些基础的东西困住,我们在学习书上的代码,尝试的时候,往往是错在某一个特殊的符号上,一个基本的参数上面,而这本书,对于这些基础的东西的介绍还是非常好的。这本书的中文版现在也有了。

第二本推荐的书就是R语言实用数据分析和可视化技术,其实这本书的中文名有一定的误导性,这本书的英文名其实是R for Everyone: Advanced Analytics and Graphics,从名字就能看出作者的意图,本书的核心理念是用20%的R的功能处理日常的80%的数据分析任务,姑且不论这本书是否做到了这一点,我个人还是比较赞同这个理念的,因为R的拓展包实在是太多了,一个决策树,至少有3个包,我不是在抱怨,这是R的巨大优势,但学起来也会比较费劲。

穿插在其中,我觉得可以看一看Lynda.com出品的R Statistics Essential。 Lynda这个网站可以说是全球范围内IT在线教育出品质量最好的了,动态的视频可以帮助我们直观地了解一些操作,以及产生的结果,可以说所见即所得。

下面要介绍的可能大家就比较熟悉了,R语言经典实例,R语言实战,这两本书中,我比较推荐的是R语言实战,内容完整具体,解释清楚,不光是对于代码的解释,对于一些统计知识的介绍也是很好的。

最后,就是如果要使用R进行数据挖掘,个人比较推荐的是数据挖掘:R语言实战这本书,这是国内作者不可多得的好书,当然,数据挖掘的基本概念,不在我们讨论的范围内。

以上就是本人一些小的经验的总结,希望能够对于那些与我情况比较相似的同学有所帮助。

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2015-08-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

用数据分析告诉你数据分析师能挣多少钱

随着大数据时代的到来和数据的市场价值得到认可,数据分析师、进阶一点的还有数据挖掘工程师、甚至是金字塔顶尖的数据科学家,这些作为21世纪最性感的职业已成功吸引无数...

581
来自专栏EAWorld

上班用“蝙蝠侠电话”沟通是一种怎样的体验?

60年代始播的蝙蝠侠电视系列对蝙蝠侠这个人物本身有着极为深远的影响,同名电影在全球热映,备受全球观众青睐。其中有部电话专门用于连接蒙面蝙蝠侠。当铃声响起的时候,...

37710
来自专栏DT数据侠

一份优质的数据分析师简历,应该是这样的......

雇主们对于掌握数据分析技能的人才越来越渴求。Tableau社区里有一群别出心裁的求职者,用视觉可视化呈现了自己的简历,更直观地讲述了自己的数据分析技能,一起来涨...

1100
来自专栏达摩兵的技术空间

我将为什么而坚持写作

很多小伙伴会有写博客的冲动,尤其是写技术博客,或者说对文学感兴趣的去写小说。然而真的去坚持并且有结果的,很少。

983
来自专栏CSDN技术头条

BDTC 2014|IBM李永辉:Watson大数据与分析平台

【CSDN现场报道】2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、...

2257
来自专栏华章科技

13个大数据应用案例,告诉你最真实的大数据故事

大数据真的太神奇了,真的可以让改变一个企业的运营吗?答案是肯定的。大数据目前是当下最火热的词了,你要是不知道大数据这个概念,都不好意思在众人面前开口了。然而实际...

1862
来自专栏java一日一条

每个程序员都应该知道的成长法则

搞JAVA也有些日子了,因为我比较贪玩,上进心不那么强,跳过两次槽,每次都是逼不得已才跳的,爱安逸

1113
来自专栏SDNLAB

Linux基金会交出项目部署和加入成员答卷,迈向Harmonization 2.0时代

1998
来自专栏Flutter入门到实战

一个十几年程序员给所有新老程序员的忠告

吉日噶拉(在外企、上市公司工作过,自己也创业失败过,遇到过很多失败挫折,甚至露宿街头,但是最后还是挺过来了),是一个十几年的程序员了,里面介绍了他的相关经历,以...

3523
来自专栏测试开发架构之路

今天聊聊大数据

大数据概念 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 大数据的4V特点:Volum...

3618

扫码关注云+社区

领取腾讯云代金券