我有一个如下的数据集数据,
Region Country Market Price
EUROPE France France 30.4502
EUROPE Israel Israel 5.14110965
EUROPE France France 8.99665
APAC CHINA CHINA 2.6877232
APAC INDIA INDIA 60.9004
AFME SL SL 54.1729685
LA BRAZIL BRAZIL 56.
我希望聚合我的数据库,包括分类变量,以便每行表示来自原始数据的多个行(例如,基于学生ID)。每个列都需要保存原始数据中最常见的值(每个聚合ID)。示例:我希望按学生汇总数据,并查看最常见的分类变量级别--例如:
student class
a h (being h the dominant level for the variable "class"
我在R工作室工作
我对这个相当简单的问题表示歉意,因为尽管我在计量经济学/回归分析方面有一些R方面的经验,但我还是设法跳过学习如何在R中创建基本的汇总统计数据,如何生成一个输出来计算该特定数据的观察数。
对于此数据,如何计算特定列的每种类型的不同数目(即:“侧”列中有多少个L和Rs )?如果“侧”列等于“L”(例如,当'Side‘等于'L’时,绿色、红色或蓝色的百分比是多少?
Side State Color Type
L O Green B
R C Red Q
R O
我有如下所示的数据集
> head(n2)
# A tibble: 6 x 4
Pain Redness Swelling Tiredness
<fct> <chr> <chr> <chr>
1 Yes No No Yes
2 No No No No
3 Yes No No Yes
4 Yes No Yes Yes
5 No No No
我有一个数据集,其中包含每支球队17年来每个篮球运动员的统计数据。在R中,我试图通过使用for循环将这些球员级别的观察转换为团队级别的观察(每年),该循环遍历年份和球队,然后汇总前三名得分手的个人统计数据(得分、助攻、篮板等)。你建议我如何继续?(在下面你会发现我目前的尝试,它只从数据集的最后一支球队和年份中提取观察数据,而不能从前三名中提取其他统计数据,如助攻和篮板数)。
for (year in 2000:2017) {
for (team in teams) {
ts3_points =top_n(select(filter(bball, Tm == team & Yea
非常绿色的R用户在这里。对不起,如果有人问这个问题,并在别的地方回答,我自己也找不到任何东西。
我不明白为什么我不能让一个for循环工作,定义多个新的数据文件,但是循环遍历一个预定义的列表。
“我的列表”是从现有的dataframe的变量名称的子集定义的:
varnames <- colnames(dplyr::select(df_response, -1:-4))
然后,我想循环遍历列表,为包含汇总函数结果的列表中的每个变量名称创建一个新的数据格式:
for (i in varnames){
paste0("df_",i) <- summary(past
我希望使用R和package dplyr来准备或总结一列值,使用带有用户定义函数的汇总(在dplyr中),或者手工定义它。但是,数据没有在指定的组上聚合。有关详情,请参阅以下短文。提供了所需的结果。
library(dplyr)
ver="dplyr version 1.0.5"
#create user defined function intended for summarise()
myfun=function(values){
values^2}
进口数据
df=data.table(
grp=c("x","x","y&
假设我有如下数据
date value location
1/1 10 A
1/2 15 A
1/3 20 A
2/1 15 A
2/2 10 A
2/3 5 A
2/4 12 B
2/5 15 B
2/6 5 B
2/7 20 A
我想按位置汇总1/31之后所有超过10的值的计数。因此,我的输出将为位置A提供3,为位置B提供2。您知道如何在R中实现这一点吗?