前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言怎么获取内置数据集

R语言怎么获取内置数据集

作者头像
简说基因
发布2022-11-11 16:17:09
1.2K0
发布2022-11-11 16:17:09
举报
文章被收录于专栏:简说基因

许多 R 包中含有数据集,可以通过data函数查看或加载这些数据集,通过?获得数据集的帮助文档。

基本数据集

基本包 datasets含有 100 多个数据集(R version 4.2.0),涉及医学、自然、社会学等各个领域。

查看一下:

代码语言:javascript
复制
library(knitr)
library(tidyverse)

pkg = data(package = "datasets")
as_tibble(pkg$results[, c('Item', 'Title')])
## # A tibble: 104 × 2
##    Item                   Title                                                 
##    <chr>                  <chr>                                                 
##  1 AirPassengers          Monthly Airline Passenger Numbers 1949-1960           
##  2 BJsales                Sales Data with Leading Indicator                     
##  3 BJsales.lead (BJsales) Sales Data with Leading Indicator                     
##  4 BOD                    Biochemical Oxygen Demand                             
##  5 CO2                    Carbon Dioxide Uptake in Grass Plants                 
##  6 ChickWeight            Weight versus age of chicks on different diets        
##  7 DNase                  Elisa assay of DNase                                  
##  8 EuStockMarkets         Daily Closing Prices of Major European Stock Indices,…
##  9 Formaldehyde           Determination of Formaldehyde                         
## 10 HairEyeColor           Hair and Eye Color of Statistics Students             
## # … with 94 more rows

datasets中的数据集在 R 启动时已经自动加载到环境中了,可以直接使用,例如:

代码语言:javascript
复制
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

查看iris的帮助文档:

代码语言:javascript
复制
?iris

其他包的数据集

使用其他包的数据集,需要先加载包,再加载数据集。这里以ggplot2包举例:

代码语言:javascript
复制
library(ggplot2)
data(diamonds)

head(diamonds)
## # A tibble: 6 × 10
##   carat cut       color clarity depth table price     x     y     z
##   <dbl> <ord>     <ord> <ord>   <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1  0.23 Ideal     E     SI2      61.5    55   326  3.95  3.98  2.43
## 2  0.21 Premium   E     SI1      59.8    61   326  3.89  3.84  2.31
## 3  0.23 Good      E     VS1      56.9    65   327  4.05  4.07  2.31
## 4  0.29 Premium   I     VS2      62.4    58   334  4.2   4.23  2.63
## 5  0.31 Good      J     SI2      63.3    58   335  4.34  4.35  2.75
## 6  0.24 Very Good J     VVS2     62.8    57   336  3.94  3.96  2.48

实际上,当library(ggplot2)执行后,其中的数据集如diamondsmpg等已经可用了,无需显式加载。

但是有些包library后数据集还不可用,则需要用data函数显式加载。

最后总结

  • data(package = "package_name"),查看 R 包里有哪些数据集
  • data(dataset_name),加载数据集
  • ?dataset_name,查看数据集的帮助文档
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 简说基因 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基本数据集
  • 其他包的数据集
    • 最后总结
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档