【V课堂】数据挖掘知识脉络与资源整理(二)R语言

简介:

R是用于统计分析与绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。

与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。

特点:

  1. 免费开源.相关的论坛及资料非常丰富,外文与中文论坛也多 推荐知识论坛: http://www.ppvke.com/ Stackoverflow: http://stackoverflow.com/
  2. 全面, 是专门为统计和数据分析开发的语言,各种功能和函数琳琅满目,其中成熟稳定的一抓一把几乎任何类型的数据分析皆可在R中完成.涉及领域广泛,实际应用广泛. 相关案例教学: http://www.ppvke.com/Blog/archives/29646
  3. 拥有顶尖的绘图功能.让数据可视化更加丰富多彩, 漂亮又灵活的图,大家也都已经讲过了。原本不是什么特别突出的长处(有则好,没也没啥),不过现在数据可视化越来越热,也就一跃成为主要优点了。 R绘图教程连载: http://www.ppvke.com/Blog/?s=R%E6%95%B0%E6%8D%AE
  4. 可交互式的,简单易学虽与C语言之类的程序设计语言已差别很大(比如语言结构相对松散,使用变量前不需明确正式定义变量类型等等),但仍保留了程序设计语言的基础逻辑与自然的语言风格 推荐阅读: 1.http://www.ppvke.com/10396.html 2.http://www.ppvke.com/10399.html 3.http://www.ppvke.com/10401.html 4.http://www.ppvke.com/10371.html
  5. 兼容性高,可以从多个数据源获取数据.
  6. 平台资源丰富,新方法更新速度快. 有很多配套的"插件"为其锦上添花。比如xtable里有一个函数可以直接将R里的表格导出为TeX格式;另有RStudio的插件让你可以在同一个环境里写TeX跑R并可在你的TeX文件中插入你的R代码在R的综合档案网络CRAN中,提供了大量的第三方功能包,其内容涵盖了从统计计算到机器学习,从金融分析到生物信息,从社会网络分析到自然语言处理,从各种数据库各种语言接口到高性能计算模型,可以说无所不包,无所不容,这也是为什么R正在获得越来越多各行各业的从业人员喜爱的一个重要原因。
  7. 跨平台,可以在Windows ,Mac OS ,UNIX 上运行. 软件图形界面:

开发环境IDE界面:

从业方向:

数据分析师: 专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预姑的专业人员。

数据挖掘师: 又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

数据分析学习路线图: http://www.ppvke.com/index/myworlddata

数据挖掘学习路线图: http://www.ppvke.com/index/myworlddig

相关论坛与社区:

R官方网站: http://www.r-project.org/

R graphics manual: http://bm2.genes.nig.ac.jp/

ppv课: http://www.ppvke.com/

QQ群交流: 463227290

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2016-06-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏目标检测和深度学习

惊呆了!吴恩达的视频课程被做成了文字版

当看到这个标题的时候,你会突然发现,那些比你厉害的人还比你努力是什么感觉!!! 奔跑吧,骚年们!!!

16540
来自专栏腾讯云技术沙龙

张轲:腾讯云H5语音通信QoE优化

    11月份,W3C发布了WebRTC的标准。另外一个专注于WebRTC的国际组织RETF在12月份也发布了第一个RFC8298,目前还没有成为真正的标准。...

1.1K100
来自专栏ATYUN订阅号

上辈子是运动员?一款人脸识别AI应用检测你与哪个世界杯运动员长得最像

挪威新闻机构VG团队开发了一款全新的AI工具,使用面部识别技术,来查找与你的长相最为相似的足球运动员。

11170
来自专栏CSDN技术头条

谁是2017年的顶级开源项目?一探究竟

本文介绍了在开源界比较有名的六个项目。如果你对其中的某个项目不了解的话,赶快来学习一下吧。 ? 今天,让我们一起来看一下2017年开源界的六个顶级玩家。下面列出...

21280
来自专栏腾讯云数据库(TencentDB)

TDSQL参加全球数据库顶级盛会 VLDB 2018回顾

作者介绍:卞昊穹(hankbian):腾讯数据库TDSQL团队成员,高级工程师。中国人民大学博士,曾在SIGMOD、ICDE、CIKM等数据库相关领域顶级会议发...

66840
来自专栏腾讯音视频实验室

腾讯云H5语音通信QoE优化|云+沙龙

33020
来自专栏数据的力量

学习复杂事物的简单方式:三个步骤获得超能力

20860
来自专栏PPV课数据科学社区

【译文】怎样学习R(下)

何品言翻译,广东科技学院大学生,喜欢R语言和数据科学。 王陆勤审核,从事数据挖掘工作,专注机器学习研究与应用。 英文链接:http://www.r-blogge...

29940
来自专栏玉树芝兰

如何用Python做舆情时间序列可视化?

如何批量处理评论信息情感分析,并且在时间轴上可视化呈现?舆情分析并不难,让我们用Python来实现它吧。

45720
来自专栏架构师小秘圈

从小白到大数据架构师的学习历程

最近有很多人问我,大数据是怎么学?需要学什么技术以及这些技术的学习顺序是什么?今天我把个问题总结成文章分享给大家。 ---- 大数据处理技术怎么学习呢?首先我...

53270

扫码关注云+社区

领取腾讯云代金券