R语言中有很多绘图工具,而ggplot2是功能最全面,绘图最灵巧,且比较容易理解和上手的一个。掌握ggplot函数可以显著的提高我们数据分析的工作效率。
首先,我们需要加载tidyverse这个包,如果没有安装这个包,就需要先安装,然后才能正确加载。加载完这个包,你可以看到很多包都加载了,包括ggplot2,tibble,readr等。当然,在加载信息中,也提示了我们一些函数冲突的信息,我们在使用这些函数的时候,需要注明,它到底隶属于哪个包才行,否则可能就达不到我们想要的目的。
这里,我们使用ggplot2自带的数据集mpg,它是一个数据框,即变量和观测组成的矩形数据集合,通常变量在列,观测在行。通过观察,我们可以看到这个数据有234行,11列,即有234个观测值,11个变量。我们可以通过?mpg来了解更多关于这个数据集的信息。
下面,我们使用数据中的一些变量来进行简单图形的绘制。在这里,我们绘制一个散点图,将displ放在x轴,将hwy放在y轴。通过前面的数据集信息的查看,我们知道,displ是引擎大小,hwy是燃油效率(每单位油可以跑的高速路程),在绘图之前,我们可以想一想,他们之间是正相关,还是负相关呢?ggplot的绘图过程详见视频。
看完之后,可以思考以下几个问题:
一是ggplot(data=mpg)这个命令产生的图形是什么?
二是如何去查看一个数据集的维度及其他信息?
三是ggplot有哪些几何对象函数?
领取专属 10元无门槛券
私享最新 技术干货