我想通过将每个响应/列除以其组均值来计算相对响应值。我成功地提出了一种详尽的(因而令人不满意)的方法。我的数据集非常大,包含多个组和响应。
###############
# example
# used packages
require(plyr)
# sample data
group <- c(rep("alpha", 3), rep("beta", 3), rep("gamma", 3))
a <- rnorm(9, 10,1) #some random data as response
b <- rnorm(9,
我已经对R中的一个数据帧进行了分组和汇总,因此我现在有一个表,如下所示:
Group | Value | Count
==========================
A | 1 | 4
A | 2 | 2
A | 10 | 4
B | 3 | 2
B | 4 | 4
B | 2 | 3
C | 5 | 3
C | 2 | 6
我感兴趣的是找出值2在每组中的相对频率:
Group | Relative freq of 2
======
我想给每个组的数据。例如,我有以下数据:
df = data.frame( from = c('a', 'a', 'b'), dest = c('b', 'c', 'd') )
#> df
#from dest
#1 a b
#2 a c
#3 b d
我希望根据from值进行分组,并给每个组提供一个组号。这是预期的结果:
result = data.frame( from = c('a', 'a', 'b
我希望找到组A和组B在feature列和value列中具有相同值的行。
我的数据:
group feature value
1 A f1 1
2 B f1 1
3 A f2 1
4 B f2 0
5 A f3 0
6 B f3 1
df = data.frame(group = rep(c("A", "B"), 3),
feature = c("f1",
我想在每一组中选出最年轻的人,并按性别进行分类。
这是我的初步数据
data1
ID Age Gender Group
1 A01 25 m a
2 A02 35 f b
3 B03 45 m b
4 C99 50 m b
5 F05 60 f a
6 X05 65 f a
我想要这个
Gender Group Age ID
m a 25 A01
f a 60 F05
m
我有一个数据框架(Df),例如
group value
a 4.2
a 4.5
a 6.2
b 5.1
b 3.5
a 4.2
a 5.1
b 6.4
b 3.3
b 4.1
a 5.0
所需的输出是
group value
a 4.5
a 6.2
a 5.1
a 5.0
b 5.1
b 6.4
b 4.1
即,期望输出提取每个“组”的最小2“值”。例如,
4.2和4.2是a组最小的两个值,和
3.
我希望在分组变量("group")的每个级别内计算数值变量("value")的mean (或长度为1的任何其他汇总统计信息,例如min、max、length、sum)。
摘要统计应该分配给一个与原始数据长度相同的新变量。也就是说,原始数据的每一行都应该有一个与当前组值相对应的值--不应将数据集折叠为每组一行。例如,考虑组mean
在此之前
id group value
1 a 10
2 a 20
3 b 100
4 b 200
之后
id group value grp.mean.values
1
我有一个包含组和值的数据格式。首先,我计算了每组99%的分位数。现在,我要删除每个组99%分位数以上的值。
df<-data.frame(group = rep(c("A", "B"), each = 4),
value = c(c(6,5,80,4,60)*10,3,5,4))
# data
group value
1 A 60
2 A 50
3 A 800
4 A 40
5 B 600
6 B 3
7 B 5
8
我有以下数据框架df,其中有以下列:
df <-
REP METRIC BE
1 A 1
2 A 0
3 A 1
1 B 1
2 B 1
3 B 1
1 C 0
2 C 1
3 C 1
我想按REP对数据进行汇总,以便对于每个唯一的REP,如果BE是Metric A和B的1,那么添加一个新的列BEBOTH和1,否则就是0 (也就是说,如果它们中的任何一个为零,那么BEBOTH为零)。
产出应是:
REP BEB
假设我有一个带有分组变量的简单数据框架,每个组有三个xs:
df<-data.frame(grp=rep(letters[1:3],each=3),
x=rnorm(9))
grp x
1 a 1.9561455
2 a -2.3916438
3 a 0.7267603
4 b -0.8794693
5 b -0.3089820
6 b -1.7228825
7 c -0.3964017
8 c -0.6237301
9 c -0.1522535
我希望每个组将初始行作为参考行,并获得所有行的x
我有一个与下面的数据相似的数据集
Type Count
A 0.022496545
A 0.969600752
A 0.476144762
A 0.142649351
A 0.902891034
A 0.004099406
A 0.80460619
A 0.642014007
A 0.688212724
A 0.879709931
B 0.886410732
B 0.803057447
B 0.203613404
B 0.606411333
B 0.886645412
B 0.418132624
B 0.65350920
我有这张数据df
A B
value1 a
value1 b
value1 c
value2 a
value2 b
value 2 c
value 2 d
我想要这样的东西
A B group
value1 a 1
value1 b 1
value1 c 1
value2 a 2
value2 b 2
value2 c 2
value2 d 2
也就是说,我想创建一个变量,对相同的A值进行分组。你怎么说这是最好的方法?
示例
id code
我有一个数据框,包含一个分组变量("Gene")和一个值变量(" value "):
Gene Value
A 12
A 10
B 3
B 5
B 6
C 1
D 3
D 4
对于我的分组变量的每一级,我希望提取最大值。因此,结果应该是一个数据帧,其中分组变量的每个级别都有一行:
Gene Value
A 12
B 6
C 1
D 4
aggregate能做到这一点吗?