我有3个随时间变化的变量值不均匀的数据,如下所示:
每个观察的数据帧只包含有值的变量。
dataframe_a
time_1
a 1
b 2
c 3
d 4
dataframe_b
time_2
a 1
c 3
d 4
e 2
dataframe_c
time_3
a 1
b 3
d 4
e 2
并需要一个数据框架,例如:
time_1 time_2 time_3
a 1 1 1
b 3 NA 3
c 4 3 NA
d
我一直在使用包含大量数据的WHO包。get_data函数允许将多个表拉进data.frames列表(使用lapply),这是一件好事。
### Socio-Economic indicators
# health expenditure, GDP per capita, Literacy Rate,
Fertility Rate, Pop under 1 USD, Population,
socio_econ <- c("WHS7_143", "WHS9_93", "WHS9_85", "WHS9_95
我想根据ID修改纵向数据,检查数据波形1(A)中的ID和第2(B)波中的数据是否匹配。另外,我想将A和B的数据结合到一个基于ID的文件中。
我试图使用merge()代码合并该文件,并试图通过性别变量检查ID是否匹配。但是,如果两个波中没有相同的变量,则很难检查ID,而且也不直接检查每个ID。
ID <- c(1012,1102,1033,1204,1555)
sex <- c(1,0,1,0,1)
A <- cbind(ID,sex)
A <- as.data.frame(A)
ID <- c(1006,1102,1001,1033,1010,1234,1506
我想使用嵌套full_join将几个数据帧合并在一起。此外,我希望能够为所有列添加后缀,以便在合并数据帧时,每个列名都能指明它来自哪个数据帧(例如,一个唯一的时间标识符,如T1、T2等)。 x <- data.frame(i = c("a","b","c"), j = 1:3, h = 1:3, stringsAsFactors=FALSE)
y <- data.frame(i = c("b","c","d"), k = 4:6, h = 1:3, stringsAsFactors=F
我想合并以下3个数据帧,并使用-1填充缺失的值。我想我应该使用fct merge(),但不知道怎么做。
> df1
Letter Values1
1 A 1
2 B 2
3 C 3
> df2
Letter Values2
1 A 0
2 C 5
3 D 9
> df3
Letter Values3
1 A -1
2 D 5
3 B -1
愿望产出将是:
Letter Values1
数据采集样本:
ID RNG_BEFORE_WDL RNG_AFTER_WDL
<int> <chr> <chr>
1 3490115 Less than 10K Less than 10K
2 3564671 Less than 1K 0
3 3914214 Less than 30K 0
4 3971472 More than 60K More than 60K
5 3971472 More than 60K More than
我有一个由100多个列组成的数据框架。我想要做的是,对于所有的列名,我想在列名的开头和列名的末尾添加回滴答(`)。
例如:
column name is testing user. I want `testing user`
有没有一种方法可以在pyspark/python中做到这一点。当我们应用代码时,它应该返回一个数据帧。
以下是三个数据帧。一些行在另一个或两个数据帧中重复。我希望提取其中至少两行或三行之间的交集。 tmp_df1
Chr Start End Ref Alt Func.refGene Gene.refGene
1 chr1 1647537 1647537 C T intronic CDK11B
2 chr1 1647605 1647605 C G intronic CDK11B
3 chr1 1647699 1647699 C G intronic CDK11B
4 chr1 2030058 2
我试图通过第一列合并表格列表,但顺序正在改变,我希望行的顺序应该与第一次迭代相同。
so the output of my first function is list of dataframes
df_list1 <- data.frame(c= c("tml 14","tml 26","tml 73","tml 24","tml 95","tml 60","tml 77","tml 8","tml 19"),
是否有一种"tidyverse“方式来加入data.frames列表(a la full_join(),但对于>2 data.frames)?由于调用了data.frames,我有一个map()列表。我以前曾使用Reduce()做过类似的事情,但希望将它们合并为管道的一部分--只是还没有找到一种优雅的方法。玩具例子:
library(tidyverse)
## Function to make a data.frame with an ID column and a random variable column with mean = df_mean
make.df <-
我有一个df,用于计算a group_by之后的一些比率(除数),用于单个列(cond3)的条目上的多个条目:
cond1 cond2 cond3 value
foo oof A 1
foo oof B 2
foo oof D 3
foo bar A 1
foo bar B 2
foo bar C 4
foo bar D 4
buz oof A 2
buz oof C 1
buz oof B 3
bar rab C 3
有三个数据集
父类:
ID
Ants
Cow
Dog
Hen
Tiger
df1:
ID Number1
Ants 6
Dog 2
Hen 7
df2:
ID Number2
Ants 5
Cow 7
Tiger 3
最终数据(df3)应该如下所示:
ID Number1 Number2
Ants 6 5
Cow 0 7
Dog 2 0
Hen 7 0
Tiger 0 3
在R中有什么直接的方