ddply:为什么这不起作用？

ddply是一个在R语言中用于数据处理的函数，它用于按照指定的变量对数据进行分组，并对每个分组应用指定的函数进行处理。然而，ddply函数在某些情况下可能不起作用的原因有以下几个可能性：

数据框格式不正确：ddply函数要求输入的数据框格式正确，即每列的数据类型应该一致，并且列名应该正确。如果数据框格式不正确，ddply函数可能会出错或者不起作用。
缺少必要的包：ddply函数属于plyr包的一部分，因此在使用ddply函数之前，需要确保已经正确安装并加载了plyr包。如果没有加载plyr包，ddply函数将无法使用。
函数参数设置错误：ddply函数有多个参数，包括数据框、分组变量和应用的函数等。如果参数设置错误，比如指定的分组变量不存在或者应用的函数不适用于数据框的某些列，ddply函数可能会出错或者不起作用。
数据量过大：如果数据量非常大，ddply函数可能会因为内存不足而无法正常工作。在处理大数据集时，可以考虑使用其他更高效的函数或者分块处理的方法。

总之，要解决ddply函数不起作用的问题，需要仔细检查数据框格式、包的加载情况、函数参数设置以及数据量等因素，并逐一排除可能的错误原因。如果问题仍然存在，可以尝试使用其他类似的函数或者寻求专业人士的帮助。

如何让循环创建新的对象作为我的结果？

、、、

我是R的新手，我正在学习如何编写循环。我想知道我尝试用这个循环做的事情是否有意义： require(plyr) year = c("1993", "2009") for (i in 1:2) { temp <- subset(census.long,trt=="RIL" & dbh > 50 & date==year[i]) tab.res[year[i]] <- ddply(.data=temp, .(spcode), .fun=summarise,

浏览 1提问于2013-06-12得票数 0

2回答

将函数中的值传递给ddply

、

我让ddply按照下面的思路构建data.frame： out <- ddply(data, .(names), varA = sum(value > 10)) 这很好用，所以我试着把它放到一个函数中 func <- function(val.in) { out <- ddply(data, .(names), varA = sum(value > val.in)) } func(10) 这不起作用--看起来ddply找不到'val.in‘ Error in eval(expr, envir, enclos) : object 'val.

浏览 0提问于2013-05-31得票数 2

回答已采纳

1回答

在使用ddply进行子集期间计算变量的级别

、

我需要在一个巨大的矩阵中为一个因子的每个级别计算变量的类别数量。我试着在下面的脚本中使用ddply，但它不起作用，我也不知道为什么。下面是我的代码和一个示例数据帧： a<-as.factor(c(1,1,1,2,2,2,3,3,3)) b<-as.factor(c(1,1,1,2,2,3,1,2,3)) df=data.frame(a=a,b=b) records=ddply(df, .(a), summarise, categories=length(levels(b)) ) record

浏览 0提问于2012-03-22得票数 1

2回答

ddply聚合列名

、

我正在使用ddply聚合我的数据，但是还没有找到一种优雅的方法来将列名分配给输出数据框。目前我正在做这件事： agg_data <- ddply(raw_data, .(id, date, classification), nrow) names(agg_data)[4] <- "no_entries" 还有这个 agg_data <- ddply(agg_data, .(classification, date), colwise(mean, .(no_entries)) ) names(agg_data)[3] <- "avg_no_ent

浏览 0提问于2011-07-29得票数 9

回答已采纳

2回答

如何在使用ddply时检索全局索引？

、、

我试图从plyr包的钻石数据集中找到价格/克拉的最佳交易所以我知道 new = ddply(diamonds, c("cut", "color", "clarity"), transform, ecart= price/carat - mean(price/carat)) best = ddply(new, c("cut", "color", "clarity"), summarize, which(ecart == min(ecart)) 但当我这么做的时候 he

浏览 2提问于2011-07-09得票数 1

回答已采纳

1回答

使用ddply而不是循环减法来处理特定类别

、、

我有一个包含2个数值列的数据集。示例数据集： X = c(-1:-20) Y=c(11:30) df=as.data.frame(cbind(X,Y)) 我的数据集如下所示： X Y 1 -1 11 2 -2 12 3 -3 13 4 -4 14 5 -5 15 6 -6 16 7 -7 17 8 -8 18 9 -9 19 10 -10 20 11 -11 21 12 -12 22 13 -13 23 14 -14 24 15 -15 25 16 -16 26 17 -17 27 18 -18 28 19 -19 29 20 -20 30 我

浏览 0提问于2013-04-30得票数 0

回答已采纳

1回答

用于ddply的旧代码不工作。

、

我有一些代码来自“使用R的行为科学纵向数据分析”(2012)，它不起作用。这就是数据的样子： subid risk gen eth ell sped att ell2 risk2 grade read 1 HHM F Afr 0 N 0.94 No DADV 5 172 1 HHM F Afr 0 N 0.94 No DADV 6 185 1 HHM F Afr 0 N 0.94 No DADV 7 179 1 HHM F Afr

浏览 3提问于2015-10-28得票数 1

回答已采纳

2回答

如何根据其他变量创建新的序数变量？

、、、

大家好，社区的所有成员。这个问题可能与我之前问过的另一个问题相同，所以可能是重复的，但请求输出肯定不同于前一个问题。我有以下数据库： ID1=rep((1:1),20) ID2=rep((2:2),20) ID3=rep((3:3),20) ID<-c(ID1,ID2,ID3) DATE1=rep("2013-1-1",10) DATE2=rep("2013-1-2",10) DATE=c(DATE1,DATE2) IN<-data.frame(ID,DATE=rep(DATE,3)) 我想创建一个新的变量，它可以识别每个id记录了多少个burst

浏览 0提问于2013-05-04得票数 2

回答已采纳

1回答

函数和运算符的区别

我被定义为绑定函数， b <- function(f,...) function(x) f(x, ...) 所以我可以这样做(这是一个假的例子) d = data.frame(x=c(1,2,1), y=c(10, 20, 5)) ddply(d, ~x, b(transform, y=sum(y))) 而不是 ddply(d, ~x, function (df) { transform(df, y=sum(y)) } 现在，我尝试定义一个运算符 '%b%' <- function(x,...) b(x,...) 并尝试 ddply(d, ~x, transform

浏览 1提问于2012-06-26得票数 0

回答已采纳

2回答

在Google中运行DDPLY时出错

、、

我正在使用Google与一组成员一起完成最后一个项目。不幸的是，Colab不起作用了，我收到了这个错误。我成功地安装并调用了软件包的库，但是当我运行DDPLY代码时，Colab就不能工作了。如果有人能提供关于如何解决这一问题的洞察力，我们将不胜感激！

浏览 0提问于2021-04-09得票数 0

回答已采纳

2回答

使用plyr按类别计算最频繁级别

、

我想使用下面的代码用plyr逐个计算最频繁的因子级别。数据帧b显示请求的结果。为什么c$mlevels只有"numeric“值？ require(plyr) set.seed(0) a <- data.frame(cat=round(runif(100, 1, 3)), levels=factor(round(runif(100, 1, 10)))) mode <- function(x) names(table(x))[which.max(table(x))] b <- data.frame(cat=1:3,

浏览 1提问于2013-03-02得票数 4

回答已采纳

3回答

学习理解plyr，ddply

、

我一直试图通过尝试不同的变量和函数来了解plyr是如何工作的，并查看结果。所以我更多的是寻找plyr如何工作的解释，而不是它回答的具体修复。我已经看过文档了，但我的新手大脑还是不明白。一些数据和名称： mydf<- data.frame(c("a","a","b","b","c","c"),c("e","e","e","e","e","e") ,c(1,2,3,

浏览 1提问于2012-07-07得票数 23

回答已采纳

1回答

除时间周期外的R-多输入变量时间序列分析

、

我认为我遇到的问题应该是常见的，但由于某种原因，我到目前为止还找不到好的答案，所以我的问题是-我正在使用R进行时间序列分析，我的数据看起来像这样 time_period customer# sales_amt sales_qty 2013/01 123 $xxx,xxx.xx xxx 2013/01 345 $yyy,yyy.yy yyy 2013/02 .... 到目前为止，我可以逐个手动为每个客户做，但当我有100多个客户时，不可能这样做，我希望能够一次完成它，以包括所有客户，而且，稍后我还必须包括其他输入变量，如除了customer#

浏览 0提问于2014-02-07得票数 0

1回答

在R中参数化ddply

、

对于数据框： exampleDF <- structure(list(val1 = structure(c(1L, 2L, 1L, 3L), .Label = c("MX", "SS", "VF"), class = "factor"), var2 = c(1, 2, 3, 4)), .Names = c("val1", "var2"), row.names = c(NA, -4L), class = "data.frame") 而不是做： ddply(exampleDF,

浏览 0提问于2012-10-17得票数 0

回答已采纳

1回答

R中的两个整数比较：“较长的对象长度而不是较短的对象长度的倍数”

、、

当比较两个整数和用户定义函数中的数据子集时，我在R中得到了一个“更长的对象长度而不是更短的对象长度的倍数”警告。用户定义的函数只返回从dataframe获取的整数子集的中位数： function(s){ return(median((subset(EDB,as.integer(validSession) == as.integer(s)))$absStudentDeviation)) } (我最初没有as.integer矫顽器在那里。我把它们放在那里是为了调试，文本，而且我仍然收到一个错误。) 我遇到的具体错误是： In as.integer(validSession) == a

浏览 1提问于2011-12-18得票数 1

2回答

在函数中获取和处理ddply中的整行

、

在ddply中获取一个或多个数据进行处理很容易，但是有没有一种方法可以获取整个当前行并将其传递给一个函数？或者获取一组在运行时确定的列？让我举例说明：给定一个数据帧，比如 df = data.frame(a=seq(1,20), b=seq(1,5), c= seq(5,1)) df a b c 1 1 1 5 2 2 2 4 3 3 3 3 我可以编写一个函数来沿着数据框的一行对指定的列求和，如下所示： selectiveSummer = function(row,colsToSum) { return(sum(row[,colsToSum])) } 当我像这

浏览 2提问于2011-03-19得票数 3

回答已采纳

1回答

删除R中条件下的重复项

、

我想要删除重复项，并保留年份变量最大的那个。我的数据如下所示： id name year position 1 Jane 1990 Sales 1 Jane 1991 Sales 1 Jane 1992 Sales 1 Jane 1993 Boss 1 Jane 1994 CEO 2 Tom 1978 HR 2 Tom 1979 Sales 2 Tom 1980 PR 2 Tom 1981 Boss 3 Jim 198

浏览 2提问于2014-04-06得票数 1

2回答

如何通过公共ID从大型数据集中提取行，并利用这些行的方法生成具有这些ID的列

、、

我知道这是一个非常愚蠢的问题，但我不能解决它，这就是为什么问…如何通过公共ID从大型数据集中提取行，并利用这些行的方法生成一个以这些ID作为行名的列。例如： IDs Var2 Ae4 2 Ae4 4 Ae4 6 Bc3 3 Bc3 5 Ad2 8 Ad2 7 OutPut Var(x) Ae4 4 Bc3 4 Ad2 7.5

浏览 4提问于2012-10-18得票数 3

回答已采纳

1回答

如何在plyr中将变量的值赋给列名？

、、、

有没有办法在plyr中将变量的值赋给结果列名？所以在这段代码中。 column_name <- 'total' df <- data.frame(a=c('a','b'), b=c(1,2)) ddply(df, .(a), summarise, column_name=sum(b)) 正如您所知道的，这将产生一个由变量a和column_name组成的数据框架。但是，我想要的是变量a和total，其中total是由变量的值动态赋值的，因为实际上，我想在循环中处理它，而不能在ddply函数中直接指定它。仅供参考，此代码不起作用。 dd

浏览 1提问于2013-05-09得票数 5

1回答

降级R数据帧

、

我想对R data.frame中的多列进行降级。使用来自的示例 set.seed(999) library(plyr) library(plm) # random data.frame dat <- expand.grid(id=factor(1:3), cluster=factor(1:6)) dat <- cbind(dat, x=runif(18), y=runif(18, 2, 5)) #demean x and y dat.2 <- ddply(dat, .(cluster), transform, x=x-mean(x), y=y-mean(y)) 我的问题是，

浏览 1提问于2014-05-27得票数 4

回答已采纳

1回答

R:如何在自定义函数中从名称中获取值或对象？

、、、

我正在尝试创建一个用于批处理分析的自定义函数，一开始是这样的： > myfunction <- function(DATA, col1, col2, col3){ > print(class(col3)) #"name" > print(is.object(col3)) #FALSE > library(plyr) > output <- ddply(DATA, .(eval(col1), eval(col2)), summarize, N=sum(eval(col3)),...) > ... >

浏览 22提问于2021-11-19得票数 1

回答已采纳

1回答

虚函数和误差？

、

第一次在这里发帖！我在使用ddply函数时遇到了问题。我有一个表，我想用"LC“一栏概括一下，并在列”Area“中添加值： ID LC per Area 1 1 7 0.29 62428.3 2 1 7 0.79 170063.3 3 1 4 0.40 86108.0 4 1 7 0.43 92566.1 5 1 6 1.00 215270.0 6 1 7 0.61 131314.7 基于这个数据，我完全可以预料到这一点： LC Area 4 86108.0 6 215270.0 7 456372.4 应用ddply函数，我得到了以下结

浏览 2提问于2012-12-12得票数 5

1回答

为什么在ggplot中的组或面中不能使用`umsum`？

、

从借用示例 x <- data.frame(A=replicate(200,sample(c("a","b","c"),1)),X=rnorm(200)) ggplot(x,aes(x=X,color=A)) + stat_bin(aes(y=cumsum(..count..)),geom="step") 正如您所看到的，cumsum可以跨组和跨方面工作。我想知道为什么它会这样做？显然，..count..是在组内完成的，为什么cumsum在应用于..count..时不是这样呢？ggplot会在内部将所有..coun

浏览 1提问于2013-10-15得票数 5

2回答

如何在R括号表示法中使用函数变量？

、

我正在尝试计算一些简单的比率，并使用R的括号表示比率的基线。现在，我正在努力定义一个允许我参数化基线的函数。我不想硬编码它，因为我有几个这样的代码。而且，我真的不明白R到底在做什么，我非常好奇如何实现期望的行为。下面是一些基于示例数据的代码： data("singer", package = "lattice") # this is what I want, but what currently doesn't work my_ratio <- function(voice) { ddply(singer, ~ voice.part,

浏览 0提问于2012-09-01得票数 2

回答已采纳

1回答

在两列而不是一列上使用tapply

、、

我想计算几个带有R的曲线图的基尼系数，取消软件包reldist中的gini()函数。我有一个数据框，我需要使用其中的两列作为基尼函数的输入。 > head(merged[,c(1,17,29)]) idp c13 w 1 19 126 14.14 2 19 146 14.14 3 19 76 39.29 4 19 74 39.29 5 19 86 39.29 6 19 93 39.29 gini函数使用第一个元素(这里是c13 )进行计算，第二个元素是对应于c13中每个元素的权重(这里是w)。所以我需要使用列c13和w，如下所示： gini(merge

浏览 5提问于2013-03-01得票数 0

回答已采纳

1回答

将文本添加到ggplot2中的多面图，日期在X轴上

、、、

我是ggplot2的新手，它很棒，但我在一件事上遇到了困难。我绘制了一系列跨越一年的时间序列。X轴由Date类的变量派生而来。我对曲线图进行了多面化，这样我就有了7个具有独立y轴的列中的时间序列。这张图的重点是比较每个方面与顶部方面的相关性。我想做的最后一件事是将文本(每个方面和第一个方面之间的估计皮尔逊相关性)添加到每个方面右上角的图中。这被证明是极其困难的，因为geom_text()要求文本的每一位都有x和y坐标。当X轴是日期，而Y轴对于每个面是不同的时，如何指定坐标？以下是我到目前为止拥有的一些示例数据和代码，以便您可以重现我到目前为止拥有的内容： library(ggplot2)

浏览 0提问于2012-07-13得票数 11

回答已采纳

1回答

当在另一个函数中定义聚合函数时出现的ddply错误

、

下面的几乎最小代码的要点是在函数f中应用ddply，其中ddply的聚合函数(助手)是在f的定义中自定义的。不幸的是，我不明白为什么整个代码片段的获取会在eval(expr，envir，expr)中产生一个错误:无法找到函数“助手”。当助手函数独立于函数f运行时，代码工作。当我用的未注释调用替换为时，代码将无错误地运行。您能解释错误并提供解决方案或解决方法吗？用plyr 1.8.1和R 3.0.3测试 rm (list = ls()) library(plyr) f <- function() { dfx <- data.frame( group = c(rep

浏览 2提问于2014-04-22得票数 0

回答已采纳

1回答

根据用于应用函数的.variables的排序/顺序，ddply有不同的输出。

、、、

我的全部数据(dput()的结果)在问题的末尾。我试图用ggplot()绘制一个平铺图，并且有不均匀的x和y测量值，这样瓷砖就不会填满整个区域。下面是一个例子： library(ggplot2) ggplot(data, aes(x = x, y = -y, z = d)) + geom_tile(aes(fill = d)) 我不确定，但我认为ggplot可能默认为类似于unique(data$x)[2] - unique(data$x)[1]的块大小，因此我的数据行实际上是连续的x或y度量之间的距离，而不是其他数据。我想我会使用height和ddply()为我的数据创建一个ply

浏览 3提问于2013-08-24得票数 1

2回答

将指示器变量添加到长数据框中，用于当值从一年增加到下一年时

、

我有一个很长的数据框架，包含三列fyear、tic和dcvt (财政年度、股票代码和可转换债务总额)。大约有18个财年和几千个报价器。我想添加一个指标变量，每当dcvt从一年上升到下一年时，它就是一个。我尝试过ddply，但我丢失了fyear列，并且不确定如何找回它。 library(plyr) temp <- data.frame(fyear = rep(1992:2009, 10), tic = rep(letters[1:10], each = 18), dcvt = rnorm(180, 200, 10)) my.fun <- function(x) x <- c(

浏览 2提问于2011-02-26得票数 2

回答已采纳

1回答

当使用列索引时，R ddply忽略拆分因子

、、、、

我需要使用ddply在我的数据框的多列上应用多个函数。当我使用列名(在下面的例子中是RV)时，我的拆分变量(下面的Group和Round值)起作用(我得到了每个RV和Group组合的平均值)。我需要对20列执行此操作，并且我正在考虑创建一个for循环和pass列索引。当我使用列索引时(例如，df[1]在我的数据框中是"RV“)，组和轮被忽略，并且返回轮和组的所有组合的总平均值。我尝试在new.df3中传递列名，但再次忽略了圆形和分组。 df <- data.frame("RV" = 1:5, "Group" = c("a",&

浏览 0提问于2018-06-14得票数 0

1回答

如果有条件地发生在其中一个个体中的个体群(下一个)

、、、

我回到之前的一个问题/帖子中，我得到了很好的建议，但需要额外的推动:这个想法是创建一个二进制变量，它以一个值作为任何相关家庭成员的个人地位的条件。这一价值由同一家庭的所有成员共享。我再举一个责备的例子： family <- factor(rep(c("001","002","003"), c(10,8,15)),levels=c("001","002","003"), labels=c("001","002","003"), orde

浏览 1提问于2017-01-04得票数 0

回答已采纳

1回答

如何使用字符串变量为ddply创建变量列表？

、

使用R的内置ToothGrowth示例数据集，这是可行的： ddply(ToothGrowth, .(supp,dose), function(df) mean(df$len)) 但是我希望子集因子是变量，比如 factor1 = 'supp' factor2 = 'dose' ddply(ToothGrowth, .(factor1,factor2), function(df) mean(df$len)) 这不管用。这应该怎么做呢？我想可能是这样的： factorCombo = paste('.(',factor1,','

浏览 0提问于2010-09-24得票数 10

回答已采纳

1回答

R cran，How to create a new single Factor from the Factor in How B，依附于另一列A中的系数

、

这可能是一个愚蠢的问题，但我没有完成它，在其他地方也找不到这个问题。我想要一个这样的数据集： A B green lizard blue paper blue stone blue scissor red spock red stone 变成这样： A B green lizard blue paper, stone, scissor red spock, stone 我可以用子集来做，但是A有太多的因素。我的循环也不起作用。也许有人有个好主意？

浏览 0提问于2014-03-12得票数 0

1回答

从group_by到自己的函数

这很可能是上述任何一种或两种情况的重复，如果是这样的话，我想这将是一个悬而未决的紧迫问题。使用plyr可以运行这样的操作： ddply(mtcars, .(cyl), function(x) table(x$am)) 得到很好的输出 > ddply(mtcars, .(cyl), function(x) table(x$am)) cyl 0 1 1 4 3 8 2 6 4 3 3 8 12 2 我仍然不明白为什么ddply(mtcars, .(cyl), table(am))不工作，但没关系。在dplyr中有实现上述目标的方法吗？ mtcars %>%

浏览 2提问于2015-02-11得票数 0

回答已采纳

1回答

如何识别和总结来自数据帧中匹配组的数据集？

、

下面是一个示例dataframe： set.seed(0) x1 <- c(1, 1, 1, 1, 1, 2, 2, 2, 2) x2 <- c(1, 1, 0, 0, 0, 1, 1, 1, 1) x3 <- c(1, 1, 2, 2, 4, 1, 1, 2, 1) n <- c(1, 1, 1, 5, 5, 1, 1, 1, 1) y <- rnorm(9) mydf <- data.frame(x1, x2, x3, n, y) 我想做的是用n=1标识与n=1相同的行，它们共享(x1、x2、x3)的相同值，对每个子集返回一行，其中y=均(Y)，n

浏览 1提问于2011-08-29得票数 1

回答已采纳

2回答

循环以从不同的文件创建一系列图形

、、、

我正在尝试从一系列文件中绘制一个月中每一天的长期(几年)平均降水量(pp)直方图。每个文件都有从不同位置收集的数据(并且有不同的代码)。我的每个文件都是这样的： X code year month day pp 1 2867 1945 1 1 0.0 2 2867 1945 1 2 0.0 ... 我使用了以下代码： files <- list.files(pattern=".csv") par(mfrow=c(4,6)) for (i in 1:24) { obs <- read.table(fi

浏览 0提问于2011-05-25得票数 1

回答已采纳

1回答

使用ddply +变异与自定义函数？

、

我经常使用ddply，但历史上只使用summarize (偶尔使用mutate)，只使用一些基本函数，如mean()、var1 - var2等。我有一个数据集，其中我尝试应用一个自定义的、涉及更多的函数，并开始深入研究如何使用ddply来实现这一点。我已经找到了一个成功的解决方案，但我不明白为什么它会像这样工作，而不是更“正常”的函数。相关 (我的解决方案以这个为基础) 下面是一个示例数据集： library(plyr) df <- data.frame(id = rep(letters[1:3], each = 3), va

浏览 16提问于2014-11-14得票数 6

回答已采纳

3回答

用面板数据计算12个月移动平均线

、、、

第一，全面披露。我试图严格地在带有相关子查询的MS Access中这样做，并在这篇文章中得到了一些帮助。我一开始以为我的数据很小，可以通过，但它是可怕的。作为另一种选择，我将尝试在R中运行这个程序，然后将结果写入MS Access中的一个新表。我有这样的数据，我有以下字段： rep, cyc_date, amt 按照Andrie关于滚动5年期(相对于5年平均水平)的链接示例，我试图通过获得amt字段12个月的滚动平均值。这是我的代码： library(zoo) library(plyr) library(RODBC) # Pull data from local MS Access data

浏览 0提问于2013-10-11得票数 1

回答已采纳

2回答

ddply返回的结果太多

、

由于某种原因，自从升级到R-2.13.0和升级到plyr_1.5.1.tar.gz后，我得到了比我预期的更多的结果……我在一个旧版本的plyr上尝试过(不幸的是，版本不确定，因为我刚刚覆盖了它……) library(plyr) dd <-data.frame(matrix(rnorm(216),72,3),c(rep("A",24),rep("B",24), rep("C",24)),c(rep("J",36),rep("K",36))) colnames(dd) <- c("v1"

浏览 0提问于2011-04-15得票数 2

回答已采纳

1回答

在R中将包名作为参数传递

、

我发现自己一直在使用install.package函数，特别是当我必须尝试别人的代码或运行示例时。我编写了一个安装和加载程序包的函数。我尝试了以下方法，但不起作用： inp <- function(PKG) { install.packages(deparse(substitute(PKG))) library(deparse(substitute(PKG))) } 当我键入inp(data.table)时，它会显示 Error in library(deparse(substitute(PKG))) : 'package' must be of leng

浏览 0提问于2013-02-26得票数 6

回答已采纳

2回答

可以同时使用write.table()和ddply吗？

假设我有一个这样的data.frame： a <- c(1:10,1:10,1:10,1:10,1:10,1:10,1:10,1:10,1:10,1:10) df <- data.frame(a,rnorm(100)) 我希望能够为x的每个值写一个csv文件，用ddply可以做到吗？我已经可以在几行代码中使用for循环做到这一点……但是我很好奇是否可以用ddply来做这件事。 for (x in 1:nrow(unique(df["a"]))) { tmp <- unique(df["a"]) tmp2 <- paste(tmp[x,]

浏览 0提问于2010-08-05得票数 4

回答已采纳

2回答

基于ID重复次数创建多序列向量

、、、

我有一个带有面板数据的数据框架，随着时间的推移，被试的特点。我需要创建一个列，一个序列从1到最大的年数每一个主题。例如，如果主题1在2000年至2005年的数据框架中，我需要以下顺序:1、2、3、4、5、6。下面是我数据的一小部分。最后一篇专栏(exp)是我想要得到的。此外，如果您查看第一个主题(13)，您将看到，在2008年，qtty的值为零。在这种情况下，我只需要一个NA或一个代码(0、1、-9999)，不管是哪一个。下面的数据是我为得到向量所做的，但是它不起作用。任何帮助都将不胜感激。 subject season qtty exp 13 2000 29 1

浏览 2提问于2013-11-05得票数 2

回答已采纳

2回答

在R中对数据帧的列进行计数

、、

我有一个带有一个列的dataframe "samp“(让我们称之为”评级“)，它具有几个值(假设如下之一：”好“、”中“、”坏“)。我想对其他几个栏目进行分组，计算“好”、“中”和“坏”的频率，并在新列中报告这些频率。(因此，也许col1是电影年，col2是类型，然后应该有三个专栏告诉您，每种类型的评级中有多少是针对每一年和每种类型的。) ddply(samp,c("col1","col2"), summarize, good=table(samp$rating)["good"], medium=tabl

浏览 0提问于2014-01-10得票数 0

回答已采纳

3回答

了解ddply错误消息

、

我正在尝试弄清楚为什么我在使用ddply时收到一条错误消息。示例数据： data<-data.frame(area=rep(c("VA","OC","ES"),each=4), sex=rep(c("Male","Female"),each=2,times=3), year=rep(c(2009,2010),times=6), bin=c(110,120,125,125,110,130,125,80,90,90,80,140), shell_length=c(.4,4,1,2

浏览 1提问于2015-11-19得票数 14

3回答

使用ddply设置子集

我知道这应该很简单，但我在使用ddply拆分数据帧时遇到了问题。 ID = c(1,1,1,2,2,2,2,3,4,4,4,4) date = c("4th Nov","4th Nov","5th Nov","5th Nov","6th Nov","7th Nov","7th Nov","8th Nov","6th Nov","6th Nov","7th Nov","7th Nov") df<-da

浏览 0提问于2012-01-27得票数 1

回答已采纳

2回答

求因子的最大值及其在r中的指标

、、

这应该是难以置信的简单，但我并没有设法弄清楚。我想得到每个组的最大值，如下所示。 ddply(dd,~group,summarise,max=max(value)) 但是，除了返回值和组外，我还想返回值、组和另一列日期，并在下面进行索引(显然不起作用)。我该怎么做呢？谢谢。 ddply(dd,~group,summarise,max=max(value))['date']

浏览 2提问于2015-08-21得票数 0

回答已采纳

1回答

关于R中ddply函数的疑问

、

我正在尝试通过名为ddply的plyr函数在R中执行等效的group by摘要。我有一个数据帧，它有三列(比如id、period和event)。然后，我想要计算每个id在数据框(带有SQL的count(*)... group by id)中出现的次数，并获得每个id的最后一个元素，对应于列event。下面是我所拥有的以及我正在尝试获取的内容的示例： id period event #original data frame 1 1 1 2 1 0 2 2 1 3 1 1 4 1 1

浏览 0提问于2012-07-26得票数 0

回答已采纳

2回答

根据另一个字符列(R)中的分类数据，使用聚合对一个数值变量进行求和。

、、

我在这里找到了类似的查询，但没有一个能为我工作。我在一个数据框架中列出了二进制数据，我想根据另一个变量进行聚合。例如。 Data.frame (A & B are columns) A B 1 23 0 7 0 23 0 7 1 4 我尝试了下面(在查找平均值时起作用)，并得到了以下错误消息： aggregate( A~B, data.frame, sum) Error in FUN(X[[1L]], ...) : invalid 'type' (character) of argument 理想情况下，我希望输出的值为23 = 1，7

浏览 3提问于2014-01-13得票数 0

回答已采纳

1回答

为什么我在python中找不到h2o呢？

、、

出现在上。但是我找不到它。我有3.22.0.1版本，我在下载了这个版本。在这个.whl的源代码中，我找不到ddply。但是，在文档页面中，我们看到了包含的源代码的ddply。我想知道ddply是被删除了，还是只存在于R中的h2o中，还是仅仅出现在企业版本中。为什么我找不到？

浏览 0提问于2018-11-16得票数 0

回答已采纳

1回答

bwplots的R格标

、、、

我想在每个框和晶格bwplot中标记一些统计数据。下面是一个通用的例子。 #---Some dummy data Rock<-c("Rock1","Rock2","Rock3") Zone<-as.data.frame(c("Zone10","Zone11","Zone12")) Domain<-as.data.frame(c("Domain1","Domain2")) Dt <- as.data.frame(rnorm(100)) Dt<

浏览 13提问于2014-10-06得票数 0