2018年用R语言做好五件事

2018年用R语言做好五件事

1 R语言开源,免费,跨平台。

2 R语言可以做数据科学工作流各个环节的任务。

3 R语言深受数据科学工作者的喜欢。

学习R语言,需要学以致用,活学活用。

博学之,审问之,慎思之,明辨之,笃行之。(《礼记》)

2018年,玩数据和用数据的朋友可以考虑用R语言做好这五件事。

事一:数据可视化

1 清楚每种图形所适合的应用场景

2 熟悉R语言ggplot2包的使用

3 思考利用可视化做探索性分析和数据结果表示

思维训练

1 折线图,条形图,散点图分别有什么作用?

2 ggplot2包画图的原理是什么?如何利用ggplot2设计和生成可以出版的高质量图片?

事二:数据处理

1 掌握数据集的导入和导出

2 熟悉数据的选择,变量的衍生,数据的聚合和连接

3 掌握数据格式的转换

4 熟悉readr包,dplyr包和tidy包的使用

思维训练

1 如何读取json格式数据和数据库的表数据?

2 如何把宽数据转换为长数据?

事三:统计分析

1 R语言是统计编程语言,适合做统计分析

2 R语言对统计学知识有着全面的实现和解读

3 熟悉描述性统计和推断性统计

思维训练

1 描述性统计和推断性统计的异同?

2 常用的统计模型有哪些?可以解决什么问题?

事四:机器学习

1 掌握经典的机器学习算法

2 掌握从小数据中学习,实现数据到商业价值的转换

3 熟悉一系列机器学习包的使用,例如:caret,e1071,gbm,randomForest,glmnet,xgboost等。

思维训练

1 机器学习算法如何选择?参数如何调整?

2 如何提高机器学习算法的精度?

3 如何做特征工程?

事五:数据自动化报告

1 掌握数据自动报告的生成和传播

2 掌握R语言做自动化报告的流程

思维训练

1 数据自动化报告的好处是什么?

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180107G0NT2T00?refer=cp_1026

扫码关注云+社区