我想创建一个新列,只在它与特定条件匹配时(这里是x > 2 ),然后直接为条件(x > 2)返回TRUE的这些行覆盖另一个现有列(在这里为auxiliary)。
df <- tibble(x = 1:5, y = 1:5, auxiliary = NA)
# A tibble: 5 x 3
x y auxiliary
<int> <dbl> <lgl>
1 1 NA
2 2 NA
3 3 NA
4 4 N
我有一个数据框架,其中一列是击键的列表。然后,我创建了一个自定义函数,将击键列表转换为最后一个单词。作为一个具体的例子,我从以下数据开始:
dat <- data.frame(word=c(1,1,2,2,2,2),
key=c("a","b","a","b","Backspace","c"))
然后,我调用下面的命令创建一个列,其中包含击键列表(重复是有意的,因为我需要保留每一个击键):
dat <- dat %>%
group_by(w
我想在我的数据帧中定义一个new.column。new.column从另外两列中的一列获取值。如果其他列在同一行中,则new.column的给定单元格应该仅对这些列中的单元格进行采样。
我想要的:
first.column second.column new.column
---------------------------------------
a b a
c d d
在这里,我们对first.column和second.column进行采样以定义新列。我们从第一行随机选择a,从第二行随机选择d。
这是我到目前为止尝试过的:
set.seed(1)
first = sample(c(
我知道这是这个职位的一个复杂的标题。但我还没有在网上找到我的确切情况。
我有一个命名的(非匿名)函数,它将一行的Ti球、一个字符串(结构)和一个数字(百分比)作为输入,并执行线性插值,沿着行中的一个子集迭代。(不是按列排列的操作。)它执行线性插值。它的“数学”包括使用单元格中的值以及从列名中提取的数字。这些列的名称为GTV0、GTV1、…GTV135。
这方面的工作代码如下。我在这里复制它是为了完整,尽管细节不一定与下面的问题相关。
# This function works if fed one row of a df at a time, but isn't "multi-
我有一个数据框,它由Date,Brand1Index,Brand1Volume,Brand2Index,Brand2Volume等列组成。我现在想创建一个新的数据框,它存储(Brand1Index,Brand1volume),(Brand2Index,Brand2Volume) -->新的数据框中的每个品牌的另一个数据框中的一列。我设法计算了每个品牌的产品,并将它们放入新的数据框架中。但是,我希望新数据框的列以我使用的函数命名。例如,当新数据帧的Column1表示Brand1Index x Brand1Volume时,应该这样命名。到目前为止,这些列的名称类似于“5x18.8”等。下面
我正在执行数据分析和清理R使用tidyverse。我有一个包含23列的数据框架,其中包含'NO‘、'STEADY’、'UP‘和'down’。我想将这23列中的所有值更改为0,如果是'NO',‘稳态’,而在其他情况下是1。
我所做的是,我根据名称键创建了一个列表,其中保留了我的所有列,之后我使用for循环、ifelse语句和变体。
请看下面的代码
# Column names are kept in the list by name keys
keys = c('metformin', 'repaglinide',
我正在创建一个连续的x标签为“财政年度”的条形图,如"2009/10“、"2010/11”等。我在我的数据集中有一个列,其中有一个特定的财政年度,我希望x标签开始(见下面的示例图像)。那么,我希望x标签是每一个连续的财政年度,直到现在。最后的x标签应该是"2018/19“。当我尝试用scale_x_continuous设置限制时,我会收到一个Error: Discrete value supplied to continuous scale错误。然而,如果我使用‘scale_x_离散’,我会得到一个只有两个条的图:我选择的“开始”日期和2018/19的“结束”。
Sta
我有以下数据框架:
library(tidyverse)
dat <- data.frame(foo=c(1, 1, 2, 3, 3, 3), bar=c('a', 'a', 'b', 'b', 'c', 'd'))
dat
#> foo bar
#> 1 1 a
#> 2 1 a
#> 3 2 b
#> 4 3 b
#> 5 3 c
#> 6 3 d
我要做的是创建一个新列,其中的bar列标记为其
我已经下载了数据从网上,它有所有的列名,如V1,V2等,我正在改变使用setnames从data.table软件包。
其中一个重命名的变量已结婚。当我运行表语句时
table(mydat$Married)
结果是
? l u y
6 2 519 163
这些都是每个类别的obs。现在我要换衣服了?我喜欢Y和你我试过了
gsub("?","y",mydat)
然而,这并没有改变任何事情。我该如何做到这一点。
我试图从一些遗留代码中替换不推荐的mutate_。但是,我还没有弄清楚如何正确地使用字符串的间接。这个
vignette("programming", package = "dplyr")
描述了两个主要案例,但据我(诚然有限的)理解,这两种情况都不是我所需要的。
library(tidyverse)
#set up data frame and formula
df <- tribble(~Letter, "A", "B", "C")
Formula <- "ifelse(Letter