如何在data.table中修改列表(或向量)类型的变量？_从列表或R中的向量中提取变量名_如何将列表中的嵌套变量赋给R中的新列表或向量？ - 腾讯云开发者社区

r、data.table

在下面的示例中，我需要将一个列表赋给data.table的变量code，以便将值list(11,22)赋值给dt$code。我该怎么做呢？ dt <- data.table(1:3) dt$code <- list() dt[V1==2, code:=list(11,22)] # does not work dt[V1==2, code:=.(list(11,22))] # does not work 我的问题比之前的帖子更简单、更简短。感谢您的回答： dt[V1==2, code:=list(list((list(11,22)))] # works !

浏览 18提问于2019-05-07得票数 2

回答已采纳

2回答

如何在R中进行集合乘法(笛卡尔乘积)

r、list、vector、set

我知道向量可以表示n元组，向量列表可以表示一组n元组。一个简单的算法是 AxB<-list();k<-1L for(i in seq_along(A))for(j in seq_along(B)){AxB[[k]]<-c(A[[i]],B[[j]]);k<-k+1L} 有没有更优雅的数据结构和算法来实现这一点？

浏览 1提问于2017-03-03得票数 2

回答已采纳

2回答

基于来自另一个表的搜索字符串的更新表列

r、dataframe、data.table、dplyr

我试图根据同一表中单元格A的值更新表中的单元格B。要筛选要更新的行，我使用grepl将单元格A与来自列表/表/向量或其他外部源的字符串列表进行比较。对于单元格A与搜索条件匹配的所有行，我希望更新单元格B以表示"xxxx“。我需要对表中的所有行执行此操作。到目前为止，我有这样的东西，其中cat1是一个有字符串可搜索的列表。 for (x in 1:length(cat1)){ data %<>% mutate(Cat = ifelse(grepl(cat1[i],ItemName),"xxx",Cat)) } 我愿意以任何更好的方式来完成这一任务。我尝

浏览 4提问于2015-04-16得票数 1

回答已采纳

1回答

根据嵌套列表融化data.table

r、list、data.table

我有一个这样的data.table： library(data.table) dt <- data.table(a = c(rep("A", 3), rep("B", 3)), b = c(1, 3, 5, 2, 4, 6)) 我需要对每个a的值执行一个操作(预测)，所以我决定将它们放在一个列表中，如下所示： dt <- dt[, x := .(list(b)), by = a][, .SD[1,], by = a, .SDcols = "x"] 现在，我想要“融化”(这是我想到的事情) dt回到它原来的形式。我可以在很少几

浏览 3提问于2016-08-24得票数 2

回答已采纳

1回答

R列表动态列表

r、syntax

您好，我是R的新手，对于一个学校项目，我正在尝试创建一个列表列表，我可以通过索引访问这些列表，并将其追加到列表中。就像这样 aList[1] = A, B, C aList[1] returns [1] A, B, C aList[1] += D aList[1] returns [1] A, B, C, D aList[2] = 1, 2, 3 aList[2] returns [2] 1, 2, 3 aList returns [1] A, B, C, D [2] 1, 2, 3 但是，我不确定我是否使用了正确的数据类型(当然也不是正确的语法)，因

浏览 2提问于2013-04-23得票数 0

回答已采纳

2回答

如何在R中生成这样的随机数

我想用下面的方式生成双变量。我有四个长度相等的n列表。我需要使用前两个列表作为均值列表，后两个列表作为方差列表，并生成正态双变量。例如n=2，我有(1, 2)、(3, 4)、(5, 6)、(7, 8)等列表，我需要c(rnorm(1, mean=1, sd=sqrt(5)), rnorm(1, mean=2, sd=sqrt(6)), rnorm(1, mean=3, sd=sqrt(7)), rnorm(1, mean=4, sd=sqrt(8)),ncol=2) 我如何在R中以一种更实用的方式来做这件事呢？

浏览 2提问于2012-01-25得票数 0

1回答

为什么data.table会忘记R中的列表名称？

r、data.table

下面的代码 library(data.table) dt<-data.table(a=list(b=list(c=list(d=list(e=list("f")))))) 创建一个包含一个由列表组成的列'a‘的data.table： > dt a 1: <list> “a”的列表由一组嵌套列表组成。然而，data.table忘记了‘a’中第一个列表的名称： > dt$a [[1]] [[1]]$c [[1]]$c$d [[1]]$c$d$e [[1]]$c$d$e[[1]] [1] "f" 为什么呢？名为b的列表会

浏览 0提问于2018-08-31得票数 0

2回答

如何在dplyr中对循环进行变异

r、dplyr

我想为数据帧中的一个列为一系列值创建多个滞后变量。我的代码可以成功地完成我想做的事情，但是不能根据我的需要进行扩展(数百次迭代)。我下面的代码成功地实现了我想要的，但是对于我所需要的(数百个迭代)来说，它是不可伸缩的。 Lake_Lag <- Lake_Champlain_long.term_monitoring_1992_2016 %>% group_by(StationID,Test) %>% arrange(StationID,Test,VisitDate) %>% mutate(lag.Result1 = dplyr::lag(Result,

浏览 0提问于2019-05-01得票数 4

回答已采纳

2回答

获取字符向量的所有组合

r、loops、combinations、tidyeval、quosure

我正在尝试编写一个函数来动态地group_by字符向量的每个组合。这是我如何设置我的列表： stuff <- c("type", "country", "color") stuff_ListStr <- do.call("c", lapply(seq_along(stuff), function(i) combn(stuff, i, FUN = list))) stuff_ListChar <- sapply(stuff_ListStr, paste, collapse = ", ") stuf

浏览 6提问于2020-05-06得票数 0

2回答

如何基于列名的字符向量在I中子集data.table (如查找NAs)

r、data.table

这应该很容易，但谷歌和我都失败了。假设我有这些数据： library(data.table) mydata <- data.table(a = c(1, NA), b = c(NA, NA), pointer = c(1,2)) 我想得到a和b都是NA的行。当然，我可以手动这样做，比如： mydata[is.na(a) & is.na(b)] 但是在其他代码中出现了这个问题，我想根据列名的字符向量(或者列表，或者其他什么，这是灵活的)来实现这个问题，比如： myvector <- c(&#

浏览 3提问于2021-04-20得票数 1

回答已采纳

2回答

在Java中更新多线程共享列表

java、multithreading

我正在尝试创建一个程序，其中整数列表是使用多个线程进行排序的，这些线程都可以在多个步骤中读取它并写入它的特定部分。每个线程都是同一对象的一个实例，并与列表中同一部分上的其他线程一起工作。我的问题是，每个线程都看不到另一个线程对列表所做的更改，因此列表的一些初始元素会在途中丢失。有没有办法刷新或更新列表，以便线程能够拥有更改后的列表？

浏览 0提问于2016-11-05得票数 0

3回答

汇总数据集中的所有重复值

python、r、dataset、data-analysis

我有一个数据集中，在一个列中，我有一个人的名字，在另一个列中，我有她为某项服务支付的金额。我想要建立一个名单，所有的人的名字，由他们的总金额，无论他们所做的服务。示例： Ann 100 John 200 Matt 150 John 150 John 150 Ann 300 Erik 150 =========== John 500 Ann 400 Matt 150 Erik 150 我认为这需要查找个人姓名的所有重复实例，然后将支付的值存储在列中，最终汇总所有内容。问题是我的名单太大了，无法检查个人的名字。也就是说，我不

浏览 5提问于2021-11-30得票数 0

回答已采纳

1回答

使用向量列表中名称的r子集数据帧列

r、dataframe

是否可以使用存储在列名数组中的列(如c("col1“、"col9”、"col6")中的列名将数据帧列子集(为新的df)？我知道我可以使用df[colname]语法引用df中的一个列，但它不允许我对多个列进行引用： df X1 X2 X3 1: a 1 3 2: b 5 3 3: a 3 4 4: c 6 5 5: c 2 2 cnm<-c("X2","X3") df[[cnm]] .subset2中的错误(x，i，精确=精确)：下标超出界谢谢

浏览 0提问于2016-09-14得票数 5

1回答

放进数据表括号中的变量就这样出来了。(R语言)

我正在使用R数据表包。我只想使用变量访问数据表的特定列。但是，当我将变量放在数据表的括号中时，就会出现一个变量。不是数据表。例如, df <- matrix(1:12,nrow=4,ncol=3) df <- as.data.table(df) colnames(df) <- c("A","B","C") list <- c("A","B","C") df[,"C"] 以上代码的结果只是"C“而不是(9，10，11，12)。我试图找出这个问题的其他结

浏览 0提问于2020-04-08得票数 0

回答已采纳

2回答

查找原始数据表中是否至少包含列表中的一个单词

r、datatable

我对R和数据表非常陌生，所以我的问题可能听起来很明显，但我在这里搜索了类似的问题，但无论如何都找不到解决方案。因此，最初，我有一个数据表，其中一行包含字段，这些字段有许多由&连接在一起的数据值(实际上这些值都是单独的单词)。我还有一个单词列表( list )。这个列表很大，有38000个不同的单词。但出于示例的目的，让我们假设它很小。 list <- c('word1'，'word2，'word3') 我需要的是过滤数据表，以便我只有包含单词列表中至少一个单词的行。我通过&取消了数据连接，并创建了一个列表 fields_wit

浏览 7提问于2020-05-02得票数 0

回答已采纳

1回答

按组将多个函数应用于data.table中的多个列

r、data.table

这个问题是这个问题的延伸：。给一个data.table DT <- data.table("a"=1:5, "b"=2:6, "c"=c(1, 1, 2, 2, 2)) 我想将函数列表应用到a和b的c分组中。如果我不按c分组，我就会得到预期的结果： my.summary = function(x) list(mean = mean(x), median = median(x)) DT[, unlist(lapply(.SD, my.summary)), .SDcols =

浏览 0提问于2020-07-31得票数 1

回答已采纳

2回答

如何在C++中动态更新for循环的条件？

c++、for-loop、conditional

以以下代码片段为例： // x is a global vector object that holds values of type string as follows, vector<string> x // x is filled/populated via the function Populate_x(y,z); Populate_x(y,z); for (auto i : x) { string v = check(i); Populate_x(v,v); } 我的问题是，当从for循环中调用Populate_x(v，v)时，如何在基于上述for循环的范

浏览 1提问于2017-02-18得票数 1

回答已采纳

1回答

还有一个适用的问题

r、apply

我完全相信，一个高效的R程序应该尽可能避免使用循环，而应该使用应用函数的大家族。但如果没有痛苦，这是不可能发生的。例如，我面临一个问题，其解决方案涉及应用函数中的和，因此，结果列表被简化为单个值，这不是我想要的。具体而言，我将尝试简化我的问题，假设是N =100 sapply(list(1:N), function(n) ( choose(n,(floor(n/2)+1):n) * eps^((floor(n/2)+1):n) * (1- eps)^(n-((floor(n/2)+1):n)))) 如您所见，内部的函数会导致构建向量的长度爆炸，而使用内和则会将所有内

浏览 1提问于2014-11-09得票数 0

回答已采纳

1回答

基于逻辑向量选择data.table中的列

r、data.table、logical-operators

假设我有以下data.frame和以下data.table： DF = data.frame(x=rep(c("a","b","c"),each=3), y=c(1,3,6), v=1:9) DT = data.table(x=rep(c("a","b","c"),each=3), y=c(1,3,6), v=1:9) 使用data.frame，我可以根据逻辑向量选择列，如下所示： DF[,c(TRUE,TRUE,FALSE)] 结果是： x y 1 a 1 2 a 3 3 a 6 4 b 1

浏览 0提问于2015-10-23得票数 16

回答已采纳

1回答

将大字符向量导出为R中的CSV文件

r、memory、vector、export、export-to-csv

我一直在寻找一个合适的答案来解决我的问题，但还没有找到确切或合适的答案。我有一个大的字符向量(大约400万个元素，远远超过3GB的大小)。我希望输出/导出这个大字符向量作为CSV文件，其中每个元素代表一行。使用write.table、write.csv或write.csv2导出此文件会导致内存分配问题。现在，我已经尝试了RSQLite包和data.table包中的fwrite函数。两者似乎因不同的原因而不起作用。 RQSLite方法花费了+4小时的时间来处理，我最终不得不将它杀死。 fwrite()函数要求输入一个data.frame。为了将大字符向量强制放入data.frame

浏览 1提问于2016-05-06得票数 0

回答已采纳

1回答

在data.table中应用和if

r、data.table、finance、quantitative-finance

我想在我的data.table中检查以下内容：我们删除Rt或Rt-1大于300%和(1+Rt)(1+Rt-1)-1小于50%的回报率。现在我有了一个包含大量返回列的data.table，其中每个colum代表一个公司，行是日期特定的，返回是在Data.table ReturnsDS01中，它们也有缺失的值(NA)。我试图通过以下代码应用这个程序： ReturnsNEW <- ReturnsDS01[,lapply(.SD, function(x) ifelse((x > 3 || shift(x, fill = NA) > 3) && ((1+x)(1+

浏览 0提问于2018-08-30得票数 0

回答已采纳

1回答

将变量列表转换为data.table对象

r、data.table

是否有更优雅的方法将变量列表转换为data.table对象？这并不能给出预期的结果。 require(data.table) set.seed(1) Var.List <- list(a=sample(letters, 10, rep=T),b=rnorm(10), c=rnorm(10)) data.table(Var.List) 下面的内容确实提供了所需的结果，但是对于大列表/表来说却是缓慢的。有更好的办法吗？在聚合foreach包的结果时，我经常会遇到这个问题。 data.table(as.data.frame(Var.List)) a b

浏览 2提问于2014-04-28得票数 3

回答已采纳

6回答

c++是否在值参数中返回数据？

c++

我在试着理解两者的区别 void getval(const int record, int32* val, bool allowExc) const; 和 void getval(const int record, vector<int32>* value, bool allowExc) const; 我需要返回int32s的列表。第一个示例可以返回一个ints32s列表还是只返回一个？任何帮助我们都将不胜感激

浏览 0提问于2011-04-09得票数 1

回答已采纳

2回答

嵌套命名列表到数据帧

r、list、dataframe、nested

我从分析中得到了下面的命名列表输出。可复制代码如下： list(structure(c(-213.555409754509, -212.033637890131, -212.029474755074, -211.320398316741, -211.158815833294, -210.470525157849), .Names = c("wasn", "chappal", "mummyji", "kmph", "flung", "movie")), structure(c(-220.11943

浏览 4提问于2015-11-03得票数 3

回答已采纳

3回答

我如何在R中制作这个表？

r、dataframe、data.table、tidyverse

我如何制作这样的表： ? 在此表中，Col_1和Col_2是自变量，而Col_3是因变量( Col_1 + Col_2 = Col_3 ) 有谁可以帮我？

浏览 21提问于2020-04-28得票数 0

回答已采纳

1回答

如何在应用族中分配？

r、dataframe、apply

我有一个包含多个因子的data.frame，我想为所有这些因子重命名因子级别。例如： mydf <- data.frame(col1 = as.factor(c("A","A",NA,NA)),col2 = as.factor(c("A",NA,NA,"A"))) mydf <- as.data.frame(lapply(mydf,addNA)) 请注意，现实生活中的示例远不止两列。因此，我想使用apply将其他级别名称分配给所有这些列，就像在下面这样： levels(mydf$col1) <- c("1

浏览 1提问于2012-02-27得票数 5

回答已采纳

3回答

在使用:=时，动态列名似乎有效，但在data.table中使用=时则不起作用。

r、data.table、eval、dynamic-columns

使用这个虚拟数据集 setDT(mtcars_copy<-copy(mtcars)) new_col<- "sum_carb" # for dynamic column referencing 为什么第一例有效，而第二例无效？ # Case 1 - Works fine mtcars_copy[,eval(new_col):=sum(carb)] # Works fine # Case 2:Doesnt work aggregate_mtcars<-mtcars_copy[,(eval(new_col)=sum(carb))] # error aggreg

浏览 2提问于2019-06-20得票数 1

回答已采纳

3回答

如何在列表中找到向量子项的交集

r、list、vector、intersection

我有一个向量(字符)的列表。例如： my_list <- list(c("a", "b", "c"), c("a", "b", "c", "d"), c("e", "d")) 对于这三个向量的交集，我可以使用：Reduce(intersect, my_list)。但是正如你所看到的，在这三个向量中没有共同的元素。那么，如果我想在列表中找到“至少”出现一定次数的公共元素，该怎么办

浏览 1提问于2016-09-15得票数 5

回答已采纳

1回答

将列表列表转换为强制数据帧

r、list、dataframe

这里是生成列表x的列表，如下所示： list1 <- list(NULL, as.integer(0)) list2 <- list(NULL, as.integer(1)) list3 <- list(1:5, 0:4) x <- list(a=list1, b=list2, c=list3) X的结构如下： str(x) List of 3 $ a:List of 2 ..$ : NULL ..$ : int 0 $ b:List of 2 ..$ : NULL

浏览 2提问于2017-01-12得票数 1

3回答

将列表列添加到R中的数据表返回不一致的输出-功能或错误？

r、data.table

我使用$向R中的data.table添加列表列。当data.table有多行时，这是预期的。 library(data.table) dt2 <- data.table(x = 1:2) dt2$y <- list(c(1, 1), c(2, 2)) dt2 #> x y #> 1: 1 1,1 #> 2: 2 2,2 但是，当data.table只有一行时，只会返回列表中向量的第一个元素，并显示警告： dt1 <- data.table(x = 1) dt1$y <- list(c(1, 1)) #> Warning in `[&l

浏览 1提问于2018-07-26得票数 6

1回答

R-子集dataframe数组中的where字段

r、subset

在R中是否可以创建一个子集函数，用于检查列值是否在项目列表中。这可能看起来像这样(我已经检查过了，但这不起作用)： sub <- subset(data, field IN c(1,2,3))

浏览 0提问于2016-04-13得票数 1

3回答

利用R中的数据向量对data.table进行滤波

r、data.table

如何创建数据向量来过滤data.table？ timeframe = as.Date(seq(ISOdate(1997,06,12), Sys.time(), "weeks")) timeframe2 = c("1997-06-12", "1997-06-19") tmp = data[Name == "aaa" & Date %in% timeframe] #doesn't return data tmp = data[Name == "aaa" & Date %in% timefr

浏览 0提问于2018-03-04得票数 0

回答已采纳

1回答

从分组数据返回嵌套列表

r、data.table

我在data.table中有数据，如下所示： #Load in example data library(jsonlite) library(data.table) json<-'[{"id":"a","group":"foo","value":2.7408},{"id":"b","group":"foo","value":6.5785},{"id":"c","group":

浏览 3提问于2016-04-01得票数 1

回答已采纳

1回答

在R中操作嵌套列表

r、lapply、nested-lists

我的数据是列表结构中的基因，如下所示： >listoflists <- list(samp1 = c("ENSG00000000003", "ENSG00000000005", "ENSG00000000419", "ENSG00000000457"), samp2 = c("ENSG00000002834", "ENSG00000002919", "ENSG00000002933"), samp3 = c("

浏览 4提问于2020-02-04得票数 0

回答已采纳

1回答

如何在循环中使用cbind创建矩阵

我试图用R写一个函数，它返回一个k列的矩阵，其中k是一个函数参数。这些列是在函数内部由循环形成的，我使用了(Assign(粘贴)，i)来命名它们为col.1、.、col.i。到目前为止还不错，代码可以正确地生成列向量。函数中已经定义的是向量，col.2到col.k。X也被定义为等于col.1。然后，我尝试在函数中使用一个循环，用于cbind()列，如下所示： for (i in 2:k){ X <- cbind(X, col.i) } 错误消息是"object 'col.i‘not“。我没有太多的编码经验，所以这可能是初学者的错误，但我会感谢任何建议。

浏览 3提问于2019-12-06得票数 0

回答已采纳

1回答

使用purrr::map向data.tables列表分配一个新列

r、purrr

我试图在列表中的所有data.tables中添加一个新列。列表中的所有data.tables都具有相同的结构。 reprex:让我们简单地列出两个可数据的ldt library(data.table) dt1 <- data.table(x=1:3,y=(1:3)^2) dt2 <- data.table(x=5:7,y=(1:3)^2) ldt <- list(d1=dt1,d2=dt2) 现在，假设我想在两个数据表中添加一个新的列z，其中的值存储在字符向量中： new_col <- c("DOC1","DOC2") 所以我想把DOC1

浏览 0提问于2018-04-18得票数 2

回答已采纳

1回答

如何从具有命名值的向量创建数据表并保留其名称？

r、data.table

我有一个具有命名值的向量： v = c(a = 10, b = 20) 我想创建一个data.table并将名称保留在单独的列中。

浏览 3提问于2016-04-27得票数 9

1回答

无法从数据帧中删除列，输出将变为逻辑向量

r、dataframe、data.table、splitstackshape、csplit

我从data.frame函数得到的cSplit似乎有问题。在没有NAs的情况下，我无法从下面的代码中提取列： data_places <- data_table[ , colSums(is.na(data_table)) == 0 ] 输出是一个Named logi向量，而不是一个没有包含NAs行的列的data.frame。这个问题主要是由于data.frame输出的cSplit函数的splitstackshape包。使用data.table包也会出现此问题。我尝试创建一个新的data.frame，它提取cSplit函数的data.frame输出的列，上面的代码工作得很好。 cSp

浏览 3提问于2016-03-04得票数 2

回答已采纳

1回答

在R中意外地更新变量

我正在尝试获取在初始csv加载之后添加的列名列表。如果在添加列名之后没有更新变量，那么如何将它们添加到变量中？我希望只有名字和年龄会从my_cols中打印出来，但是它也在打印IsJon library(data.table) Name <- c("Jon", "Bill", "Maria", "Ben", "Tina") Age <- c(23, 41, 32, 58, 26) df <- data.table(Name, Age) my_cols <- colnames(df)

浏览 8提问于2022-03-01得票数 2

回答已采纳

3回答

如何将列列表传递给data.table，其中有些列是预先确定的

r、data.table

将字符向量和列名作为列的列表传递给data.table？我希望能够使用data.table生成R中的一个列的子集，我可以在前面确定其中的一些列，并将预定的列表作为字符向量传递，然后与静态列列表相结合。也就是说，考虑到这一点： a <- 1:4 b <- 5:8 c <- c('aa','bb','cc','dd') e <- 1:4 z <- data.table(a,b,c,e) 我想这么做： z[, list(a,b)] 它产生这个输出： a b 1: 1 5 2: 2 6 3: 3

浏览 5提问于2014-06-17得票数 4

回答已采纳

3回答

如果在R中更改数据帧中的某些行和列中的值，我如何使用？

r、if-statement、subset

我有一个有200行和150列的数据框架。在这些列中，我希望更改大约50行和100列的NAs。下面是我的数据框架(一小部分)的一个例子： >df Bird Mammal Type 1 NA 1 A 2 1 0 B 3 1 0 A 4 0 NA A 5 NA 1 A 6 0 0 B 7 0 0 A 8 NA NA A 9

浏览 3提问于2016-02-15得票数 1

回答已采纳

2回答

如何在熔化id.vars时指定一个空的data.table向量？

r、data.table、melt

我想融化一个data.table，而不包括任何ID列。 dt <- data.table::data.table(iris)[1:10] data.table::melt(dt, measure.vars=c('Petal.Length', 'Petal.Width')) 在不指定id.vars的情况下，所有非measure.vars列都被视为id.vars。这可以在事实发生后通过从熔体中选择变量/值来处理。例如，下面的代码生成我正在寻找的输出： data.table::melt(dt, measure.vars=c('Petal.Length&

浏览 2提问于2019-11-13得票数 5

2回答

data.table的`i`表达式中的NA (可能存在错误)

r、data.table

当i包含NA时，不返回该特定行。我不确定这是不是故意的行为，或者是吗？ require(data.table) x = data.table(a=c(NA, 1:3, NA)) x[a>0] a 1: 1 2: 2 3: 3 x[!(a>0)] a 1: NA 2: NA x[a<0] Empty data.table (0 rows) of 1 col: a x[!(a<0)] a 1: NA 2: 1 3: 2 4: 3 5: NA > sessionInfo() R version 2.15

浏览 1提问于2013-07-07得票数 3

回答已采纳

2回答

如何在Haskell中实现真正的向量？

data-structures、haskell、data-types

如何在Haskell中实现真正的向量类型？为了成为向量，它必须按顺序存储在内存中，并使用O(1)随机访问。但是Haskell隐藏了它的内存管理，它的数据类型描述了树！那么，你如何表达这种要求呢？

浏览 0提问于2014-07-11得票数 5

1回答

R可变长度矢量或变量中的列表

r、list、vector、d3.js、dataframe

我正在使用R为D3可视化准备一些数据。可视化是使用以下结构创建的(这是.csv文件中的一行，随后在javascript中转换为JSON )。 Joe.Schmoe, joe.schmoe@email.com, Sao Paulo, ["Community01", "Community02", "Community03"], ["workgroup01","workgroup02"] 这是单行。标头将是： Person, Email, Location, Communities, Workgroups 您会注意到，

浏览 0提问于2015-06-02得票数 2

1回答

星火DataFrame如何区分不同的VectorUDT对象？

apache-spark、dataframe、pyspark、apache-spark-mllib、apache-spark-ml

我正在尝试理解DataFrame列类型。当然，DataFrame不是一个物化的对象，它只是一组Spark的指令，将来要转换成代码。但我认为，这个类型列表代表了在执行操作时JVM中可能出现的对象类型。 import pyspark import pyspark.sql.types as T import pyspark.sql.functions as F data = [0, 3, 0, 4] d = {} d['DenseVector'] = pyspark.ml.linalg.DenseVector(data) d['old_DenseVector'] =

浏览 1提问于2016-07-31得票数 7

回答已采纳

2回答

R中的“双”数

r、dplyr

我试图得到一个双向量的每个元素的频率，表示一个网络的度，以绘制度分布。我试过像这样使用计数： > count(degree) 其中，度包含数据，如下所示： > degree 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 7 6 7 6 30 59 103 39 298 20 39 58 34 40 18 26 11 26 17

浏览 1提问于2021-06-23得票数 1

回答已采纳

1回答

为什么中位数跳过data.table (整数对双)？

r、integer、double、data.table、median

我有一个名为data.table的enc.per.day，用于每天的邂逅。它有2403行，其中规定了服务日期和当天看到的病人人数。我想看看在任何类型的工作日里看到的病人的中位数。 enc.per.day[,list(patient.encounters=median(n)),by=list(weekdays(DOS))] 这一行产生了一个错误 [.data.table中的错误(enc.per.day，，list(patient.encounters =中位数(N))，：j列不计算为每个组的一致类型:第4组的结果有第1列“整数”，但期望类型为'double‘ 下面的一切都很好 t

浏览 5提问于2012-08-25得票数 35

回答已采纳

1回答

将系数转换为数字

r、csv、import、type-conversion

我有一个三百万行，500列的数据集。尽管列是数字列，但从csv文件导入时，所有列都被视为系数，而不是数字。我正在尝试使用以下命令将它们转换回数字 wikifixedn<-as.numeric(as.character(wikifixed)) 维基修复就是数据帧。这需要永远的时间..。我的MacBook专业版，16 at内存，2.3 than核心i7，已经在这上面搅动了一个多小时了。我能看到我在这个过程中走了多远吗，或者这个过程是否在进行中？这里有没有另一种更快的方法来处理会话问题？顺便说一下:在导入csv文件时，我尝试使用以下命令强制将列视为数字 > wikifixed<

浏览 0提问于2015-03-29得票数 2

2回答

如何使用R中的循环，使用对象名称列表从相关的数据文件中提取某些列？

r、list、loops、dataframe

我编辑了我的问题我使用下面的代码行创建了一个由78个对象的名称组成的列表，我希望在代码中使用这些对象。最后，我想在我的工作中或多或少地将相同的功能应用于所有这些功能。 total = len.part * len.report # This is equal to 78 nam.value <- list() # Reporters and Partners are the name of countries # Values is the name of my big dataframe which I am subsetting for(i in Reporters) { f

浏览 1提问于2016-11-13得票数 0

回答已采纳