我正在尝试使用bomrang包和tidyverse.汇总一些降雨数据,我尝试使用dplyr::group_by(year)来计算年平均降雨量,然后使用summarise和mean来计算。但是,我没有得到不同的年度平均值,而是在整个数据帧中获得了相同的平均值。
# load the libraries
library(bomrang)
library(tidyverse)
# get the data
perth <- get_historical(009225, "rain")
# group by year and calculate average rainfal
我有一个包含id、date和details列的数据x:
id date details
1 28-07-2017 20:01:30 NA
2 28-07-2017 18:01:30 NA
1 28-07-2017 22:02:20 SQL
2 28-07-2017 19:01:30 SQL
1 29-07-2017 22:20:00 NA
3 30-07-2017 18:01:30 NA
3 31-07-2017 18:01:30 SQL
4 28-07-2017 18:01:30 NA
我希望我的数据是这样的:
id date
嗨,在那里,我试图得到一个整数列的和,其中一个单独列中给定的日期在给定的参数之间。
下面的SQL查询做我想做的事情,但是在sqldf中查询太慢了,所以我需要找到一个R等价的查询。数据是医院的插曲,其中停留栏显示了该事件在医院的天数。df表包含每个病人的索引和EndDate (AnonID)。
SELECT m.*, b.Sum
FROM df
LEFT JOIN
(SELECT AnonID, SUM(e.Stay) AS Sum
FROM
假设我有一个data.frame
A B C
x q 4
x p 2
y q 0
y p 8
我希望使用B==q选择所有行,并计算C的相应平均值,并将其添加为附加行,例如A==z、B==o,对于C,则是刚刚计算的平均值。
这基本上就是dplyr对列所做的,但应用于行。因此,我的问题是:是否有任何方法来应用dplyr操作而不是行上的列?当然,更好的是用于行操作的类似dplyr的包。
(我的实际data.frame当然由更多的行和列组成)
诚挚的问候
我在(function (classes,fdef,mtable):找不到签名‘’missing‘’的函数‘n’的继承方法,我找不到问题所在。 我正在使用我自己的数据遵循Trevor Paulsen的示例Visualizing the Customer Journey with R and Adobe Analytics Data Feeds。下面我提供了一个我的数据的例子。 library(dplyr)
library(plotly)
##data example
newdata <- data.frame(customer_id = c(
10002133,10002133,10
我试图比较分类数据的方法,即按性别分组的教育(整数)(男性和女性)。因此,我使用了以下代码来查看它们的含义:
gss %>%
group_by(sex) %>%
summarise(xbar = mean(educ))
此代码提供了一个表:
Sex xbar
Male NA
Female NA
我不明白为什么会这样,因为我的教育矢量有数值和NA (很少)。请帮我得到数值。