我使用R来识别数据帧的两列中的配对值,这些值与另一个数据帧的两列中的配对值相同。我以为我找到了解决办法,但结果与我所期望的不太一样,我想知道是否有人能解释原因。
df1看起来是这样的:
Col1 Col2 Col3
A 1000 5
A 1500 10
A 2000 15
A 2500 20
B 900 5
B 1200 10
B 1500 15
C 1000 5
C 1200 10
C 1700 15
C 2200 20
C 2250 22
df2包含与df1相同的内容,外加
我正在处理包含日期字段作为字符的covid数据。
我试图找到最大日期,然后尝试使用dplyr命令,这给了我错误:df %>% select(date) %>% max()。
Error in FUN(X[[i]], ...) : only defined on a data frame with all numeric variables
作为max(df$date),它运行得很完美,给了我结果:[1] "2020-08-17"。
我无法理解为什么会发生这种情况。这是数据的代码等等:
library(flexdashboard)
library(tidyverse)
我想将数据帧中的字符变量列表转换为数字格式。我使用了变换和LAPPLY函数。
方法1
var <- c('year', 'age', 'days', 'visits')
df <- lapply(var, function(x) {transform(df, x = as.numeric(x))}
方法2
var <- c('year', 'age', 'days', 'visits')
for (i in 1:length(var)) {
我有一个数据集,其中一个因素有很多级别(+/- 140),因此(我认为) lm函数失败:
Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) :
contrasts can be applied only to factors with 2 or more levels
我想做的是子集lm-函数,只使用比x观测值更多的因子级别。
例如,该data.table有一个因子(some_NA_factor),对于该因子,级别1, 2 , 4, 5有17个观测值,而级别3有16个。我想直接(在lm-functio
我很难用不成对的t检验和聚合函数。
示例
dd<-data.frame(names=c("1st","1st","1st","1st","2nd","2nd","2nd","2nd"),a=c(11,12,13,14,2.1,2.2,2.3,2.4),b=c(3.1,3.2,3.3,3.4,3.1,3.2,3.3,3.4))
dd
# Compare all the values in the "a" column that match wit
我有一个.csv文件形式的数据集(基本上是:人们对酒的选择与周围音乐播放的来源有关)。将其作为数据帧读取会导致如下所示的df: Music Wine
1 French French
2 Italian French
3 None Italian
4 Italian Italian
5 French Other
... 作为一个表,它看起来像这样: Wine
Music Other French Italian
French 35 39 1
None 4
如果我有如下数据
a b
1 5 red
2 11 red
3 7 red
4 1 red
5 3 green
6 8 green
7 12 green
8 6 green
9 2 blue
10 9 blue
11 10 blue
12 4 blue
如何从每个因素中选择某个元素?
例如,我怎样才能选择.
每种颜色的第三种元素。
每种颜色的最小值。
我想以数据形式显示结果,显示每种颜色的结果。
像这样
result
red 1
green 3
blue 2
我有一个数据帧,看起来像这样:
df = data.table(type=rep(x=LETTERS[1:2], each=4),year=list(2009,2010,2013,2016,2003,2005,2009,2015), outcome = list(1,2,1,4,3,1,5,3))
type year outcome
1: A 2009 1
2: A 2010 2
3: A 2013 1
4: A 2016 4
5: B 2003 3
6: B 2005 1
7