文章/答案/技术大牛

发布

社区首页 >问答首页 >每月中位地块与#obs。在r-studio中每月运行第二轴

问每月中位地块与#obs。在r-studio中每月运行第二轴
EN

Stack Overflow用户

提问于 2013-11-06 16:35:59

回答 2查看 99关注 0票数 1

我有一个data.frame，由两个变量组成，每个变量250万个。

str(values)
data.frame':    2529905 obs. of  2 variables:
 $ Date : Factor w/ 498 levels "1977-11","1978-06",..: 108 60 12 108 58 108 132 188 51 60     ...
$ Value: num  223000 171528 110269 426000 172436 ...
> head(values)
 Date    Value
1 2003-01 223000.0
2 1999-01 171528.0
3 1992-01 110268.6
4 2003-01 426000.0
5 1998-11 172436.5
6 2003-01 334000.0

我想用每次约会的中位数做一个data.frame：

library(plyr)
medianperdate = ddply(values, .(Date), summarize, median_value = median(Value))

> str(medianperdate)
'data.frame':   498 obs. of  2 variables:
 $ Date        : Factor w/ 498 levels "1977-11","1978-06",..: 1 2 3 4 5 6 7 8 9 10 ...
 $ median_value: num  106638 84948 85084 75725 88487 ...
> head(medianperdate)
     Date median_value
1 1977-11    106638.35
2 1978-06     84947.65
3 1985-07     85083.79
4 1986-05     75724.58
5 1986-11     88487.14
6 1986-12     98697.20

但我想要的，是一个额外的列，每月统计观察(例如。2003-01年间，所使用的数据将是对象“值”。

还有一个额外的列，我在其中定义它是哪个类的房子：

a : < 200 000 
b : < 300 000 & > 200 000
c : < 300 000 & > 2000000

我将继续尝试，但因为我已经被困了几个小时，我将非常感谢帮助！！

如果不清楚，我能理解什么。下面的testdataframe显示了我希望我的dataframe看起来像

> testdf
Year MedianValue HouseClass #Observations
1 1999-1      200000          B           501
2 1999-2      150000          A           664
3 1999-3      250000          C           555

subset

median

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-11-06 16:41:24

就像我对你上一个问题0的回答一样

library(data.table)
dt <- data.table(df)


dt2 <- dt[,list(
   medianvalue = median(value),
   obs = .N
   ),
   by = "Date"
]

dt2[,HouseClass := "c"]
dt2[obs < 300000,HouseClass := "b"]
dt2[obs < 200000,HouseClass := "a"]

票数 0

Stack Overflow用户

发布于 2013-11-06 16:45:13

您可以在apply和apply类似的函数(包括plyr函数)中编写函数。看起来会是这样的：

ddply(values, .(Date), .fun = function(x) {
  median <- median(x)
  value <- ifelse(median < 200000, 'A', ifelse(median < 300000, 'B', 'C'))
  n <- length(x)
  return(c(median, value, n))
})

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/19817567

复制

相似问题

问每月中位地块与#obs。在r-studio中每月运行第二轴
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问每月中位地块与#obs。在r-studio中每月运行第二轴EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问每月中位地块与#obs。在r-studio中每月运行第二轴
EN