我正在一个名为与生俱来的数据集上做R编程问题。首先,为了安装和加载数据集。键入以下命令
library(MASS)
birthwt
输出如下所示:
该数据集是关于“与低出生体重相关的危险因素”。
我正在使用table()
函数(或其他一些方法)来找出研究中有多少女性是白人,2)吸烟,3)有婴儿被认为是低出生体重。(这意味着这三个属性/特征结合在一起。)
这是我的密码:
birthwt3 <- data.frame(birthwt$race, birthwt$smoke,birthwt$low)
table(birthwt3)
这是输出:
但是从输出来看,多维表变得更难理解了,我找不到这个问题的答案。
有人能帮我解决这个问题吗?还有什么其他有用的功能,我可以用来查看多维表格,这并不难理解?
发布于 2017-10-22 21:25:08
我肯定会使用group_by
和summarise
包提供的dplyr
函数。试试这个:
birthwt <- MASS::birthwt
### install dplyr if you haven't already
#install.packages("dplyr")
library(dplyr)
birthwt %>%
group_by(race, smoke, low) %>%
summarise(n = n())
你应该得到这个:
# A tibble: 12 x 4
# Groups: race, smoke [?]
race smoke low n
<int> <int> <int> <int>
1 1 0 0 40
2 1 0 1 4
3 1 1 0 33
4 1 1 1 19
5 2 0 0 11
6 2 0 1 5
7 2 1 0 4
8 2 1 1 6
9 3 0 0 35
10 3 0 1 20
11 3 1 0 7
12 3 1 1 5
现在很容易回答这样的问题:“有多少X种族的女性吸烟并生下体重以下的孩子?”
https://stackoverflow.com/questions/46878919
复制相似问题