庄闪闪的R语言手册

106 篇文章
11.6K 次阅读
28 人订阅

全部文章

庄闪闪

R数据科学|5.5.3内容介绍

最简单的一种方法是:使用geom_point()画出散点图。你可以将相关变动看作点的模式。例如,你可以看到钻石的克拉数和价值之间存在一种指数关系:

11420
庄闪闪

R分享|玩转数据处理120题

前段时间推了一篇推送:R语言数据处理120题。如今张敬信老师[1]将这120题进行重新整理,写了一份基于tidyverse的版本。

7110
庄闪闪

R代码忘记保存,系统崩溃了怎么办?

这些糟心的情况想必每个打工人都不想经历,偏偏我就是那个倒霉蛋,今早打开电脑发现昨晚写的代码忘记保存,心态崩到想当场飙眼泪,冷静下来之后开始寻找解决方案:

18120
庄闪闪

R数据科学|5.5.2内容介绍及课后习题解答

要想对两个分类变量间的相关变动进行可视化表示,需要计算出每个变量组合中的观测数量。常用的两种方法有:

18630
庄闪闪

R数据科学|5.5.1 内容介绍

如果变动描述的是一个变量内部的行为,那么相关变动描述的就是多个变量之间的行为。相关变动是两个或多个变量以相关的方式共同变化所表现出的趋势。查看相关变动的最好 方...

8420
庄闪闪

R数据科学|5.5.1 习题解答

前面对比了已取消航班和未取消航班的出发时间,使用学习到的知识对这个对比的可视化结果进行改善。

18520
庄闪闪

R数据科学|5.4内容介绍及习题解答

我们不建议使用这种方式,因为一个无效测量不代表所有测量都是无效的。此外,如果数据质量不高,若对每个变量都采取这种做法,那么你最后可能会发现数据已经所剩无几!

14120
庄闪闪

esquisse包—不写代码生成ggplot图

最近学习可视化时发现了一个好用的包,可以直接使用“拖拽”的方式生成绘图,不需要写任何代码!这个包是esquisse,具体介绍可以见对应的github[1]。这是...

11530
庄闪闪

R数据科学|5.3内容介绍

上一期我们对《R数据科学》第3.7节进行了内容介绍和习题解答,细心的读者可以发现,这里直接跳转到了5.3节了。原因在于中间各节内容干货较少,也没有习题,所以就跳...

9220
庄闪闪

R数据科学|5.3课后习题解答

研究 x、y 和 z 变量在 diamonds 数据集中的分布。你能发现什么?思考一下,对于一条钻石数据,如何确定表示长、宽和高的变量?

27350
庄闪闪

私人定制日历代码改进

大家知道Rstudio导出带中文图会出现乱码的形式(或者说是省略号的情况),如下所示:

8920
庄闪闪

R数据科学|3.7内容介绍及习题解答

虽然与summarize()函数结合起来使用是最有效的,但分组也可以与mutate()和filter()函数结合,以完成非常便捷的操作。示例如下:

10510
庄闪闪

R数据科学|3.4内容介绍及习题解答

通过基于变量名的操作,select()函数可以让你生成一个有用的变量子集。基本用法如下:

10430
庄闪闪

R可视乎|2021年日历大派送

一眨眼2020即将过去,2020年是杂乱的一年,感谢我们还活着。让我们放下这年,展望2021年吧。要不用R给2021年做个私人定制版日历吧?

8020
庄闪闪

R数据科学|3.6习题解答

这个问题是数据分析的一个基本问题:成本函数。作为分析人员,我们之所以对航班延误感兴趣,是因为对乘客来说代价高昂。在许多情况下,到达延迟更重要。在大多数情况下,迟...

13820
庄闪闪

R语言实现逻辑回归模型

首先,本章节使用到的数据集是ISLR包中的Default数据集,数据包含客户信息的模拟数据集。这里的目的是预测哪些客户将拖欠他们的信用卡债务,这个数据集有1w条...

23320
庄闪闪

R可视乎|瀑布图

瀑布图(waterfall plot) 用于展示拥有相同的X轴变量数据(如相同的时间序列)、不同的Y轴离散型变量(如不同的类别变量)和Z轴数值变量,可以清晰地展...

8310
庄闪闪

R数据科学|3.6内容介绍

上节我们对选择现有的列和使用mutate添加新列做了介绍。现在对数据框使用summarize()进行分组摘要进行介绍。函数功能:summarize()可以将数据...

6820
庄闪闪

Rstudio常用快捷键以及窗口操作有用技巧

如果想看所有快捷键,可按alt + shift + k;或者在界面中点击Tools + Keyboard Shortcuts Help。以后记得不是很清楚的可以...

16020
庄闪闪

R数据科学|3.5内容介绍及习题解答

上节我们对选择现有的列进行了介绍与习题解答,现在对数据框添加新列进行介绍,这里使用mutate()函数,注意:mutate()总是将新列添加在数据集的最后。

14930

扫码关注云+社区

领取腾讯云代金券