给定一个列出用户、产品和产品功能的tibble,我尝试计算拥有特定产品功能的不同产品用户的比例: library(dplyr)
#>
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#>
#> filter, lag
#> The following objects are masked from 'package:base':
#>
#> inte
我需要找到不同组之间的共同值,最好使用dplyr和R。 从我这里的数据集中: group val
<fct> <dbl>
1 a 1
2 a 2
3 a 3
4 b 3
5 b 4
6 b 5
7 c 1
8 c 3 预期输出为 group val
<fct> <dbl>
1 a 3
2 b 3
3 c 3 因为在所有组中只出现数字3。 这段代码似乎不起作
set.seed(123)
d <- data.frame(
group = rep(1:3, each = 3),
year = c("2001", "2002", "2003", "2002", "2003","2004", "2001", "2002", "2004"),
value = sample(1:9, r = T))
如果同一组中最后一行的年份是"2003“,我如何提取前一行?
例如:
group year
在一列数据中,我试图确定一个新的高点和前一个新的高点之间的最小值。在下面的例子中,我标记了新的高点在哪里,它们之间的最小值是多少。什么是R公式来解决这个问题?在excel中,我可以使用匹配和max/min公式来完成它。我不知道如何在r列的某一段中找到最小值。
data
0 New High
-80
-160
-160
-160
-160
-160
-347
-351
-351
-444
-444
-444
43 New High -444
43
10
10
-6
20
352 New High -6
352
352
528 New High 352
528
511
511
518
47
在R中,我有三个条件中的一个发生的事件对,并希望找到在每个条件下发生的事件对。例如:
label1 label2 factor value
bob ted A 4
bob carol A 3
ted carol A 2
bob ted B 3
ted carol B 4
bob ted C 2
bob carol C 9
ted carol C
我最近构建了一个简单的R脚本来总结三种不同的数据框架。自从更新到最新版本的R和function之后,当我在dplyr中只对其中一个数据帧使用汇总函数(其他两个都很好)时,我遇到了一个从未见过的输出。我还收到了一系列我不熟悉的警告。请注意,在更新之前,我完全按照编写的方式运行脚本,没有任何数据帧的问题。
该问题的数据框架称为VO2,其设置如下:
Name Sex VO2
AthleteA M 50
AthleteA M 52
AthleteA M NA
AthleteB M 49
A
我相信这是一件很简单的事情,但我对R.
我有三个专栏,一个是我需要标准化的价值观,一个是年龄组,一个是性别。我想要一个新的专栏,标准化是按年龄组和性别进行的,例如18-28岁的女性与18-28岁的男性有不同的分数。
R函数(Foo):打印(Foo)
agegroup gender value
1 68-90 M 0.55140187
2 38-48 M 0.93333333
3 18-28 F 0.43283582
4 0-18 F
我正在尝试从我的数据集中提取异常值,并相应地标记它们。
样本数据
Doctor Name Hospital Assigned Region Claims Illness Claimed
1 Albert Some hospital Center R-1 20 Sepsis
2 Simon Another hospital Center R-2 21 Pneumonia
3 Alvin ...
执行下面的脚本以创建测试表。
create table if not exists t1 (id1 int,id2 int);
现在,表被创建了,它是空表。
执行下面的脚本,
select max(id1), max(id2) from t1
它将返回结果下方(一行)。
max(id1) max(id2)
----------- --------
<null> <null>
执行下面的脚本,
select max(id1), max(id2) from t1 group by id1,id2
它将返回低于result(无result)。
ma
我正在尝试从数据文件列表中删除重复的行,并且只包括绝对最小的行(同时保留符号)。
gene log2
a 0.1
b 0.3
c -0.1
c 0.2
d -0.2
e -0.8
e 0.3
Desired output
a 0.1
b 0.3
c 0.1
d -0.2
e 0.3
我理解group_by函数是有用的,并且似乎适用于单个df。
df1 %>%
group_by(gene) %>%