我有相当大的历史流星站csv数据集(日风速数据来自一组地区的气象站),我需要计算每个月风速高于6m/s的平均日数。这些监测站不包含相同年数的数据。数据集的示例如下所示。
head(windspeed_PR)
STN Year Month Day WDSP WDSP.ms
1 860110 1974 6 19 9.3 4.784
2 860110 1974 7 13 19.0 9.774
3 860110 1974 7 22 9.9 5.093
4 860110 1974 8 20 9.5 4.887
5 860110 1974 9 10 3.3 1.698
6 860110 1974 10 10 6.6 3.395
因此,我基本上需要计算出WDPS.ms值对于年和每个站点(STN)的每个月大于6,然后计算每个meteo站每月平均天数。
请给我一些建议,如何计算这个值(最好以R表示)?
发布于 2015-05-20 22:53:50
这是相当简单的。
使用dplyr
library(dplyr)
windspeed_PR %>%
group_by(STN, Year, Month) %>%
summarize(n_days = n(),
n_gt6 = sum(WDSP.ms > 6),
p_gt6 = n_gt6 / n_days)
这将返回每个站点、年份、月份、测量数量、大于6的测量数以及它们的商数(测量值的比例大于6)。
在你的提问中,我不清楚你是否想进一步总结(比如说,即将崩溃的年份),但它应该成为任何额外工作的良好起点。
https://stackoverflow.com/questions/30361231
复制相似问题