使用r中的data.table创建具有不同规则的列_具有data.table的R中的条件滞后值的列_从具有不同列长度的列表中创建R中的向量 - 腾讯云开发者社区

r、dataframe、dplyr、plyr、purrr

我经常需要使用自定义函数一次通过几个列的附加变量来修改数据帧，最好是使用并行化。下面是我已经知道如何做到这一点的方法。设置 library(dplyr) library(plyr) library(purrr) library(doMC) registerDoMC(2) df <- data.frame(x = rnorm(10), y = rnorm(10), z = rnorm(10)) 假设我想要两个新列，foocol = x + y和barcol = (x + y) * 100，但它们实际上是在自定义函数中完成的复杂计算。方法1:使用rowwise mutate和mutat

浏览 1提问于2016-07-15得票数 4

2回答

将一个目录中的大量文件合并到R中的一个数据帧中

我在一个目录中有大量的数据文件(>1000)。我想将它们全部合并到R中的单个数据框中。它们都具有相同的列数量和类型。到目前为止，我所拥有的是： setwd("directory") files <- list.files() for (i in 1:length(files)) assign(files[i], read.csv(files[i])) 这将为每个1000+文件创建数据框。有没有什么方法可以合并它们，而不必键入所有1000+文件名的列表？任何帮助都将不胜感激！

浏览 0提问于2015-07-25得票数 2

2回答

运行更快的计算

r、performance、loops

我在R中有2个数据帧，其中一个是另一个的子集。我必须在其中做一些操作，并计算6个x值(代码中的DayTreat)的主数据框中子集数据的百分比。因此，我创建了一个函数来执行计算并创建一个新列。我的问题是它太慢了。有什么建议吗？ percDay <- function(fullDat, subDat) { subDat$DaySum <- NULL for (i in fullDat$DayTreat) # for each DayTreat value in fullDat. Must be `psmelt()` made phyloseq object { r

浏览 2提问于2018-06-22得票数 1

1回答

`data.table`错误：“重新排序收到不规则的长度列表”在设置键

r、data.table

我在R中有一个相当基本的data.table，有250k行和90列。我正在尝试在其中一列上键入character类的data.table。当我调用时： setkey(my.dt,my.column) 我收到以下神秘的错误消息： "Error in setkeyv(x, cols, verbose=verbose) : reorder received irregular lengthed list" 我找到了一个，但不能完全破译它的意思。我的键列不包含NA或空白值，看起来非常合理(它包含股票报价器)，并且使用默认的order()命令运行良好。更令人沮丧的是，以下代码可以正确完

浏览 0提问于2012-06-13得票数 1

回答已采纳

1回答

在总结数据时获取“未使用的参数”

我对R中的编程一无所知/zip/nada，但是我们被要求运行一些代码来总结数据框架(数据表？不确定行话)。我在一条特定的行上被抛出一个错误，我的googling没有教我足够的关于R语法的知识，让我找出它。我正在使用RStudio v1.2.1335完成R代码，R版本是R x64 3.6.1 一个dataframe是创建的，它包含了一组列，并且有大约4年的不同节点的每小时半小时的数据。作为一个非常简化的演示程序，没有所有列，如下所示： datetime node year load, generation, deltaSS ... 1/1/2014 00:00, ABC,

浏览 2提问于2019-09-18得票数 1

1回答

如何使用dplyr在R中的列表中找到唯一值出现的次数？

r、dplyr、frequency、unique-values

我从R中的sql中提取数据，数据在列表中。我希望找到每个值出现在列表的一列中的次数。我该怎么做呢？我对R很陌生。 group_by(demo) %>% summarise(unique_value = n_distinct(column_name)) 我试着在上面这样做，结果是： unique_value <int> 5 因此，有5个独特的值。如何确定每个唯一值在列中出现多少次？

浏览 2提问于2022-05-17得票数 0

2回答

匹配和替换data.table中的多个值

r、replace、data.table

我有一个包含许多错误命名条目的数据集。我创建了一个两列.csv，其中包括一个列中的旧(不正确)名称和第二个列中相应的新(正确)名称。现在，我需要告诉R用正确的名称替换数据中的每个旧名称。 testData = data.table(oldName = c("Nu York", "Was DC", "Buston", "Nu York")) replacements = data.table(oldName = c("Buston", "Nu York", "Was DC"),

浏览 2提问于2014-03-12得票数 7

回答已采纳

2回答

R数据帧检查接下来的n个变量

r、dataframe

我有一个数据框，如下所示，其中x是布尔列 id | p | q ------+-------------+---------- 1 | 1 | n 1 | 0 | y 1 | 0 | y 2 | 0 | n 2 | 1 | y 2 | 0 | n 2 | 0 | y 3 | 0

浏览 5提问于2019-08-02得票数 1

回答已采纳

1回答

向data.table中的POSIXct对象添加时区

r、data.table、posixct

我有一个data.table对象，其中的date和time列存储为IDate/ITime对象。我还有一个时区列，其中的时区是以字符形式给出的。现在，我想创建一个使用POSIXct格式的列DateTime。但是，我不知道如何将正确的时区添加到对象中。 #Create the data.table object dtData <- data.table( Index = seq(1,5), Time= as.ITime(c('16:00', '16:00', '12:30', '16:00', '15:00'

浏览 1提问于2015-05-28得票数 4

3回答

如何在多个数据文件中查找列的位置

r、dplyr、data.table、plyr、sqldf

我有许多数据帧，它们类似于下面创建的4个数据框架： red<-data.frame(a=c(1,2,3),b=c(1,4,5),d=c(1,2,3)) blue<-data.frame(a=c(1,2,3),d=c(1,2,3),b=c(1,4,5)) green<-data.frame(a=c(1,2,3),b=c(1,4,5),d=c(1,2,3)) pink<-data.frame(a=c(1,2,3),d=c(1,2,3),b=c(1,4,5)) 我想要的输出如下所示 Location |Freq/Count|Colnames 1 |

浏览 1提问于2017-11-30得票数 0

回答已采纳

3回答

通过比较两个现有列，然后删除后一个列，在R中的数据框中创建新列

r、matrix、dataframe

我还有另一个问题，在过去的几个小时里我一直在努力解决这个问题，但没有成功。它涉及到R中的一些数据集操作。假设我有以下示例数据集： a,b,v,r 1,3,1,0 2,5,1,1 3,6,0,1 1,5,1,0 2,4,1,1 3,6,0,1 我需要通过以下规则比较v，r列的值来创建第三列(例如m)。如果v= 1，r= 0，则m=0。如果v= 1，r= 1，则m= 1，如果v= 0，r=1，则m= 2。v，r永远不能取值(0,0)。我想知道如何在创建第三列的同时删除一行中的v、r列。谢谢！

浏览 0提问于2013-03-19得票数 2

回答已采纳

1回答

使用sqldf无法在R中使用秩()对函数

sql、r、syntax、sqldf

arm<-as.data.frame(matrix(c(1,1,1,2,2,6,7,4,9,10),ncol=2)) colnames(arm)<-c("a","b") 这是我在R中创建的数据集。现在我要对b列和a列进行排序。下面的代码会抛出这个错误，不管我对语法做了什么更改(比如添加[]、"“等等)。 sqliteSendQuery中的错误(con，语句，bind.data)：语句中的错误:接近"("：语法错误) 我用的是"sqldf“软件包。 arm2<-sqldf("select a,

浏览 1提问于2015-09-02得票数 6

2回答

在我自己的包中使用data.table包

r、data.table

我正在尝试在我自己的包中使用data.table包。MWE如下：我创建了一个函数test.fun，该函数只创建一个小的data.table对象，然后按"A“列对"Val”列分组求和。代码是 test.fun<-function () { library(data.table) testdata<-data.table(A=rep(seq(1,5), 5), Val=rnorm(25)) setkey(testdata, A) res<-testdata[,{list(Ct=length(Val),Total=sum(Val),

浏览 1提问于2012-05-10得票数 79

回答已采纳

1回答

R-子集dataframe数组中的where字段

r、subset

在R中是否可以创建一个子集函数，用于检查列值是否在项目列表中。这可能看起来像这样(我已经检查过了，但这不起作用)： sub <- subset(data, field IN c(1,2,3))

浏览 0提问于2016-04-13得票数 1

4回答

是否有使用列中的定性需求对数据进行子集的功能？

r、subset

我在为大型数据帧创建子集时遇到了问题。我需要提取与其中一列中两个正确城市之一匹配的所有行，但是我创建的任何子集最终都是空的。给定主要数据帧，我尝试： New = data[data$Home.port %in% c("ARDGLASS","NEWLYN")] 但是，R返回“选定的未定义列”

浏览 0提问于2020-03-11得票数 0

1回答

在R中单独列出列表的元素并创建一个新的列表

r、lapply

我有一个名为k的列表，其中嵌入了三个独立的data.frame：ts1、ts2和ts3，每个data.frame的列结构都是：X1、X2、. X10。我想用相同的data.frame名称(ts1、ts2和ts3)创建一个新列表，但是data.frame的列表只包含X1列。因此，在以下项下： set.seed(1337) ts1 <- data.frame(replicate(10,sample(0:1,10,rep=TRUE))) ts2 <- data.frame(replicate(10,sample(0:1,10,rep=TRUE))) ts3 <- data.fr

浏览 1提问于2016-03-12得票数 0

回答已采纳

2回答

将A、B列逐个元素组合到从A元素和B元素组成的范围列中

r、list、data.table、range

我正在尝试编写R代码，最好是data.table，以便根据A和B列中的信息生成最后一列(my_wanted_col) library(data.table) d <- data.table(A=c(1,2,3), B=c(5,6,7), my_wanted_col=list(1:5,2:6,3:7) ) 也就是说，创建一个范围列表的列。在每一行中，通过将A中的单元格与B (cellA:cellB)中的单元格组合来创建范围。实际数据有数以百万计的观测，但上面的例子再现了这个问题。

浏览 0提问于2020-11-06得票数 1

回答已采纳

2回答

缺少值的dplyr filter_at命令

r、dplyr

我有一个关于R和dplyr命令的问题。我得到了以下数据帧df： ID bank type 1 own online 2 own offline 3 NaN total 现在，我想结合类型“NaN”来过滤TOTAL值。我知道我可以很容易地只过滤银行列，但是我对组合两列感兴趣，其中一列是NaN。我的命令不起作用 vec <- c("total) l1 <- df %>% filter_at(vars(type,bank), any_vars(!(. %in% vec) && (!is.na(.))

浏览 0提问于2020-04-09得票数 0

2回答

ddply与列计数

r、plyr

我是R的新手，并根据这里关于StackOverflow的其他有用建议拼凑了下面的语法。我试图将名为“合并时数”的列和起来，并得到名为DOC_LINE_NUM的列的计数(按列DOC_NUM分组)。因此，对于每个DOC_NUM，计算一个和COMBINED_HOURS，并显示一个DOC_LINE_NUM计数。下面的语法可以很好地获得COMBINED_HOURS的列和，但是如何将计数逻辑合并到DOC_LINE_NUM的这个语法中呢？谢谢。 train2 <- ddply(train, c("WEEKNUM", "DOC_NUM", "DOC_LINE

浏览 1提问于2015-10-31得票数 0

回答已采纳

1回答

计算r中多个表列出现的百分比

r、data.table

我有一张表，看上去如下--一些企业，一些可能从事的实践(P1 - P4)，以及一个名为' peer‘的专栏，它是一个分组列(是的-对等的，没有对等的)。所有实习栏均为“是”/“否”： Business P1 P2 P3 P4 Peer a y n y n y b n n y n n c n y y n y d y y y y n e n n n y y f n n n y n g y y n n y h n y n n

浏览 0提问于2018-02-23得票数 1

回答已采纳

1回答

使用所有当前变量的滞后数据创建新变量

r、variables、dplyr、lag

我的数据集大约有20个列，我想为20个当前列中的每个列创建7个带有滞后数据的新列。例如，我有列x、y和z，我想为xlag1、xlag2、xlag3、xlag4、xlag5、xlag6、xlag7、ylag1、ylag2等创建一个列。我目前的尝试是在R中使用dplyr - aq %>% mutate(., xlag1 = lag(x, 1), xlag2 = lag(x, 2), xlag3 = lag(x, 3), xlag4 = lag(x, 4), xlag5 = lag(x,

浏览 3提问于2016-07-21得票数 1

回答已采纳

3回答

存储多个数据帧的有效方法？

r、memory、storage、data-manipulation

我正在将几个文件一起读取到一个数据帧列表中，以便能够将函数应用到合并的数据中，但是当我有太多的数据帧时，我遇到内存分配问题(“错误:r不能分配内存”)。例如，读取的数据帧的可变数目，让我们现在假设3个数据帧： x = data.frame(A=rnorm(100), B=rnorm(200)) y = data.frame(A=rnorm(30), B=rnorm(300)) z = data.frame(A=rnorm(20), B=rnorm(600)) listDF <- list(x,y,z) 错误:r不能分配内存我想知道这里是否有人知道，例如，一个数组还是一个包含多列的单个

浏览 3提问于2016-08-29得票数 2

回答已采纳

1回答

data.frame中具有多个值的列

r、dataframe

我想在R中创建一个data.frame，其中一些列具有多个值(所有行的变量数相同)。例如，这里是一个有两个列(cars和here )的数据框架，请注意，列价格对于每一行都有三个值。 cars price F 1000,2000,3000 GM 2000, 500, 1000 第二个问题是：现在，我想对价格列中的每个值应用相同的函数，我如何做到这一点？假设我想要创建另一列，其价格列的值为双倍。

浏览 0提问于2013-04-03得票数 3

2回答

R-如何根据同一行的另一列的值从一列中获取值

r、statistics

我有一个8列1200行的数据帧(df)。在这8列中，我希望找到第7列的最小值，并在找到第7列最小值的特定行中找到第2列的相应值。另外，第2列包含字符，所以我需要一个字符向量来给我它的值。我找到了第7列的最小值： min_val <- min(as.numeric(df[, 7]), na.rm = TRUE) 现在，我如何从列2(列的变量名是'column.2')中获得与上面计算的列7包含'min_val‘值的行相对应的值？这可能是一个微不足道的问题，但我是R的新手，因此任何帮助都将不胜感激。

浏览 0提问于2013-10-17得票数 3

回答已采纳

2回答

在带有R的大型数据集中单独运行

r、tidyr、large-data

我正在尝试分离大型数据集中的日期和时间列，以便可以仅分离时间部分。该列的格式如下： $ Start_Time <chr> "12/31/2015 05:35:00 PM", "12/31/2015 05:37:00 PM", "12/31/2015 05:37:00 PM", "12/31/2015 05:38:00... 我运行下面这行代码： separate(Start_Time, into = c("Date", "Time", "Eh")) 我得到了以下输出。 >

浏览 2提问于2020-11-08得票数 0

1回答

使用r将多个文本文件读取到数据帧中

我尝试使用R将多个文本文件读取到它们各自的数据帧中我试过files <- (Sys.glob("*.txt")) listOfFiles <- lapply(files, function(x) read.table(x, header = FALSE,sep='|')) 但这将创建一个它们的列表。有没有一个函数可以把它们读入多个数据帧？

浏览 0提问于2017-04-07得票数 1

1回答

根据列的长度删除R中的行

r、subset

我在R中有一个数据集，它有4列:海龟雏鸟的大小，巢数，年份，海滩。我想要创建一个新的数据框架，不包括我测量到的不到10只雏鸟的巢。因此，我需要根据列大小的长度排除行，以获得“年份”、“海滩”和“巢”的独特组合。谢谢。

浏览 3提问于2016-04-08得票数 0

回答已采纳

2回答

R中的矢量化计算

我用R做了一些计算，并对逻辑R的使用感到困惑。例如, table <- data.frame(a = c(1,NA,2,1), b= c(1,1,3,2)) 在这里，我将创建第三列"c“ 如果a列包含NA，则c列为0。否则，将增加a栏和b栏。所以c列应该是 c(2,0,5,3) 我写道： table$c <- 0 table$c[!is.na(table$a)] <- table$a + table$b 我的C栏是 c(2,0，NA,5) 我看到了表$c3= table$a2+table$b2 当我希望它是表$c3=表$a3+表$b3时。

浏览 4提问于2017-06-23得票数 0

2回答

使用data.table在"group“操作中设置列名

r、data.table

我是R中包的新用户，我试图给"group“命令创建的新列命名 > DT = data.table(x=rep(c("a","b"),c(2,3)),y=1:5) > DT x y 1: a 1 2: a 2 3: b 3 4: b 4 5: b 5 > DT[,{z=sum(y);z+3},by=x] x V1 1: a 6 2: b 15 我想直接命名V1 (默认)列(不必使用冒号)，可以吗？此外，是否可以在一个命令中通过操作执行几个组，这将导致如下结果： X V1 V2 1: A 6 2: B 15 谢谢

浏览 2提问于2012-11-23得票数 21

回答已采纳

2回答

R按名称访问列的数据表

r、data.table

如果我在R中有一个数据表foo，其中有一个名为" date“的列，我可以通过以下表示法获得日期值的向量 foo[, date] (与数据框不同，日期不需要用引号括起来)。如何通过编程来实现这一点呢？也就是说，如果我有一个变量x，它的值是字符串"date"，那么我如何使用该名称访问foo的列？一些有用的东西就是创建一个符号： sym <- as.name(x) v <- foo[, eval(sym)] ..。正如我所说的，这类工作是有效的，但它有一些不太正确的地方。如果代码在myPackage包中的函数myFun中，那么如果我通过以下方式显式使用该包，

浏览 1提问于2014-09-11得票数 1

3回答

将C#转换为惯用R

c#、r、idioms

最初，我使用一个简短的C#程序来平均一些数字。但是现在我想做更广泛的分析，所以我将我的C#代码转换为R。然而，我真的不认为我在R中这样做是正确的，也没有利用语言。我写R的方式和写C#的方式完全一样。我有两列的CSV。第一列标识行的类型(三个值之一: C、E或P)，第二列有一个数字。我要对按类型(C、E或P)分组的数字进行平均数。我的问题是，在R?中做这件事的惯用方法是什么？ C#代码： string path = "data.csv"; string[] lines = File.ReadAllLines(path); in

浏览 0提问于2013-08-05得票数 3

回答已采纳

2回答

将多个csv文件(并跳过每个csv文件中的2列)读入R中的一个数据文件中？

我有一个包含大约100个csv文件的文件夹，我想把它们读入R中的一个数据文件中，我有点知道如何做到这一点，但是我必须跳过每个csv文件中的前两列，这就是我被困在其中的部分。到目前为止我的代码是： myfiles <- list.files(pattern = ".csv") # create a list of all csv files in the directory data_csv <- ldply(myfiles, read.csv) 谢谢你的帮助

浏览 1提问于2019-12-30得票数 1

回答已采纳

1回答

通过重复项过滤FEC数据，并使用R跨多个数据集进行交叉引用

r、aggregate、data-science

我正在查看两位政治候选人的FEC数据。FEC数据是按个人捐赠而不是按捐赠者组织的。因此，如果某人向候选人捐赠了3次，他们的名字就会出现3次。如何使用R去掉重复的名称并创建一个包含他们的总捐款的列？那么，我如何才能看到哪些捐赠者已经向一个候选人捐赠了，也向第二个候选人捐赠了呢？

浏览 0提问于2020-04-17得票数 0

2回答

R中的data.table更新

r、data.table

(编辑) 我使用以下代码在data.table中创建两个列并使用一些数字更新它们： T <- data.table(Init_1 = rep(0, 100), Init_2 = rep(0, 100)) for (i in 1:100){ T[, Init_1 := i] T[, Init_2 := 2*i] } 我预计这段代码将向data.table T (Init_1和Init_2)添加两列，并分别填充数字：(1:100)和(2,4，...200)。但是，代码返回常量值： > T Init_1 Init_2 1: 100 200

浏览 2提问于2017-05-13得票数 2

回答已采纳

1回答

是否有按行垂直合并多个数据帧的R函数？

r、dataframe、merge、rows

我想知道是否有一个R函数可以垂直地将多个数据帧的行附加到单个数据帧中。我的数据集的列是不同的，并且具有不同的名称，所以我不能使用rbind()。我尝试了bind_rows()和smartbind()，但仍然以水平方式获得输出。

浏览 15提问于2021-11-19得票数 1

回答已采纳

3回答

创建一个基于Python中另一列的增量的列

python、r、pandas、data.table

我现在已经把注意力从R转到Python了。我经常在R中使用data.table，有时很难在Python中找到与某些函数相当的功能。我有一个熊猫数据框架，如下所示： df = pd.DataFrame({'A':' abc '，' def '，' def '，' abc '，' def '，' def '，' abc '，‘B’：13123，45,1231,1231,1231,1231,142131,4839,4341}) 我需要创建一个基于A和B的1递增的列，

浏览 3提问于2012-10-23得票数 6

回答已采纳

1回答

根据r中多个其他列的条件更新一列中的值

r、multiple-columns、conditional-formatting

R版本3.3.2(2016-10-31) R Studio版本1.0.136 平台: X86_64-apple-darwin13.4.0 (64位) 数据帧 Subject Drug Death_3MONTHS, Death_6MONTHS, Death_12MONTHS 1 1 0 0 NaN 2 1 1 NaN NaN 3 2 0 0 0 4 2

浏览 3提问于2017-03-15得票数 0

回答已采纳

2回答

使用R将多个文件加载到矩阵中

arrays、r、csv、matrix、import

我是编程领域的新手，需要帮助将文件加载到R并使用它创建一个矩阵。我可以导入单独的文件，并从中创建单独的矩阵。如何对多个文件执行此操作？我有21个文件，每个文件包含100行和100列，我需要导入每个文件并将所有内容放入一个数组中。

浏览 2提问于2013-02-27得票数 4

1回答

如何在data.table中循环？

r、loops、data.table、lapply、levels

我刚来R，不知道有没有人能帮上忙？我有200+列和一个加权列，因此我需要将每一列乘以其关联的权重，以创建新的加权列，这样我就可以进一步分析data.Each列具有多个级别，因此我的性别为2(例如，男性，女性)。如何遍历所有列以创建新变量，就像我在下面为一列所做的那样？ DF[,gender_w:=gender*weight/gender] DF[,lapply(.SD,sum, na.rm=T),by= gender, .SDcols=c(all_weighted_column_names)] 提前感谢您的建议。编辑-更多信息 DF <- (Gender = c(

浏览 28提问于2020-08-13得票数 0

1回答

合并数据文件

r、social-networking

我在R中有以下数据帧： Id Class @a 64 @b 7 @c 98 和第二个数据框架： SOURCE TARGET @d @b @c @a 这是描述社会网络中的节点和边缘。用户(前面都有@)属于一个特定的社区，并在列类中列出了这个数字。为了分析列之间的连接，我希望合并这个数据帧并创建一个新的数据框架，如下所示： SOURCE TARGET SOURCE.Class TARGET.Class @a @i 56 2 @f @k

浏览 3提问于2017-04-07得票数 0

回答已采纳

3回答

` `print(x)`没有给出与`x`相同的输出

r、data.table

在R控制台上，我预计print(x)将始终提供与x相同的输出。我一直认为控制台使用print来实际打印所有内容。但是这里有一个来自print的额外的NULL library(data.table) print(data.table(1)[0]) # Empty data.table (0 rows) of 1 col: V1 # NULL # why is this 'NULL' printed here? data.table(1)[0] # Empty data.table (0 rows

浏览 2提问于2016-09-22得票数 6

2回答

行绑定列表中的嵌套数据帧

r、tidyr、purrr

我希望有人能帮我解决我的问题。我有一个列表格式的json响应。该结构是一个列表。在每个列表中都有一个播放器列。它就像这样嵌套在每个列表中 df[[1]]$body$wildcards$players players列是每个列表中的嵌套df。我如何绑定完整列表的players列嵌套df？下面是截图的复印件。 sample <- list( list( body = list( wildcards = list( players = data.frame( firstname = c("Fernando", &#

浏览 13提问于2020-05-05得票数 1

回答已采纳

1回答

在R中创建Z-按列值分组的得分

r、normalization

我想知道在R中是否有一种简单的方法来创建一个Z分数列，按列值分组。例如，像这样转动一个数据文件 Obs Year Dollars 1 1960 2 2 1960 3 3 1960 5 4 1960 6 5 1961 15 6 1961 20 7 1961 25 8 196

浏览 0提问于2017-10-27得票数 1

回答已采纳

1回答

data.table引用语义:迭代所有列的内存使用情况

r、data.table、pass-by-reference

当使用引用语义遍历R data.table中的所有列时，从内存使用的角度来看，什么更有意义： (1) dt[, (all_cols) := lapply(.SD, my_fun)] 或 (2) lapply(colnames(dt), function(col) dt[, (col) := my_fun(dt[[col]])])[[1]] 我的问题是:在(2)中，我强制data.table逐列覆盖dt，因此我假设需要大约列大小的额外内存。(1)也是这样吗？或者在覆盖原始列之前评估所有lapply(.SD, my_fun)？运行上述变体的一些示例代码： library(data.table)

浏览 8提问于2018-09-06得票数 1

回答已采纳

2回答

如何根据R中另一列中的特定文本创建二进制列？

我在R中工作，我需要根据玩家是否有Mike这个名字来创建一个二进制列(0代表No，1代表Yes)。这是我到目前为止拥有的代码，但我不知道下一步该做什么： baseball$player_mike <- ifelse(baseball$player_name == "%Mike%", 1, 0) baseball是数据框，player_mike是binary列，player_name是球员列表(有他们的全名)。如果有任何关于我做错了什么的建议，我将不胜感激，谢谢！

浏览 0提问于2018-06-11得票数 1

1回答

在dataframe中创建新列，其升序值取决于其他列中的值

r、dataframe

我有一个非常长的数据框架(超过30万行)，包括一个任务的所有主题试验，以长格式。因此，大约300行是连续试验的一个主题，其次是另一个主题。我想要做的是创建一个新的列，每个主题的试验编号。例如： subject trial_number 101 1 101 2 101 3 102 1 102 2 102 3 我在想，我应该让R从列主题中选择一个主题号，然后创建一个升序列表，然后在所有主题号上循环这个列表。但是，我还没有弄清楚

浏览 0提问于2019-02-13得票数 1

回答已采纳

4回答

R中分号分隔列表的重新编码

我对R不熟悉，我正努力想办法解决这个问题。我有一个数据出名的一列字符向量，其中包含逗号分隔的事情列表。我想保留该列，但是为值为0(不在列表中)或1(在列表中)的每个项添加一个列。我想要做的是： library("tidyverse") colors <- c("red;blue", "red;green") df <- data.frame(colors, stringsAsFactors = FALSE) df %>% mutate(green = case_when("green" %in% strs

浏览 3提问于2020-03-27得票数 7

回答已采纳

1回答

根据另一列的条件在R data.table中重命名字符值

r、data.table

我只想根据data.table中另一个字符列中的条件，使用R重命名一个字符值。示例:如果dt$code== "J1234B“使dt$codename= "Drug1”。这两列都是字符。我是一个R新手，似乎有很大的困难做这件事，谁能帮忙？

浏览 0提问于2018-07-31得票数 0

回答已采纳

1回答

我为什么不能在Mac上的R上删除数据帧中的列

r、macos

我使用了以下命令： data = files.tsb [-c(60:113)] 这是一个巨大的数据集，所以如果您想查看我的数据，可以从这里下载我的工作区：这个问题只在我使用R时出现，但是当我尝试在Mac终端上运行它时，它工作得很好。在rows上，行被删除，而不是列。我原以为问题出在我的Gui上，但是当我使用另一个数据框架时没有问题。这是我的R版，如果有帮助的话: 3.0.2版，2013-05-17版. 谢谢!

浏览 0提问于2014-03-12得票数 0

回答已采纳

3回答