其中一个变量包含访问所在县的县代码,另一个变量包含每次访问的年份。我想要做的是总结每年有多少个县的医院就诊情况。我可以访问SAS代码,我试图在R中复制它。ED_VISIT_YEAR, count(distinct COUNTY_CD) as Counties from datasetquit; run;
我试过使用聚合函数和唯一函数以及
( Q1)我想做一个groupby、SQL风格的聚合和重命名输出列。我的问题是,我无法在这里重命名聚合变量count。order by ID, Region
正如我们所看到的,在SQL中将聚合变量count重命名为Total_Numbers对来说非常容易。我知道变量名是字符串,所以必须在引号中,但是我看到如果在dataframe函数之外使用它们,并且作为属性,我们不要求它们在引号中。就像df.ID.
我正在尝试创建一个R脚本来汇总数据框中的度量。我希望它能对数据帧结构的变化做出动态反应。例如,我有以下代码块。library(plyr) #loading plyr just to access baseball data frameAggHits$h, by=list(MyData[,cbind("id","team")]), FUN=sum)
更一般的情况下,我想写第二行,这样
我正在尝试从现有的dataframe创建一个dataframe,只为指定的列值(我的数据中的一个物种)保留特定的列。aggregate(number=RF.haul), by(Station=Station), FUN = sum, na.rm= TRUE)
我得到了各种各样的错误,主要是"object not found“和代码中的列标题,我确信这在R中是一件相对容易的事情-我只是不能理解它(我是R的新手!)