将列名传递给R dplyr group_by并汇总函数_将函数中数据框的列名传递给R中的dplyr函数count()？_将数据框行作为参数传递给R中的函数，并使用列名指定参数 - 腾讯云开发者社区

我试图在R中创建一个表，根据一个组(“处理”)计算汇总统计数据，作为一个更长的函数的一部分。在运行函数之前，我要输入dataframe名称(data)和列(y)，我需要对它们进行总结。 data = df y = df$columna x <- function(model) { summary <- data %>% group_by(Treatment) %>% summarize(Mean= mean(y), StdError = se(y), Mean_StdError = mean(y) + se(y), Max= max

浏览 1提问于2020-08-11得票数 0

回答已采纳

3回答

我能用R中的"summarise_all“函数计算所有列的标准误差吗？

r、dplyr

我正在为R中的dplyr准备课程材料。假设我们的数据集是"iris“，有人可以使用汇总所有函数来计算所有列的平均值和sd。 iris %>% group_by(Species) %>% summarise_all(funs(mean, sd), na.rm=TRUE) 然而，当我试图计算标准误差时，我得到了一个错误消息。 iris %>% group_by(Species) %>% summarise_all(funs(mean, sd, se = sd/sqrt(n)), na.rm=TRUE) 任何帮助都是非常感谢的

浏览 17提问于2020-04-30得票数 1

回答已采纳

1回答

以不同的时间间隔剪切时间/日期数据

r、intervals

我正在使用R分析从40,000多个事件中收集的365天的数据。这些事件发生在一天中的不同时间。我希望以不同的时间间隔汇总事件并计算平均值，例如2小时、8小时、12小时或每天。我见过使用CUT和AGGREGATE，但它似乎没有提供所需的间隔。任何建议都将不胜感激。

浏览 13提问于2016-08-03得票数 0

回答已采纳

1回答

摘要不再分组

r、dplyr

我觉得dplyr很棒。不过，我最近更新了包，似乎不再按组汇总。类似于升级前按组汇总的以下代码： iris_tdt <- tbl_dt(iris) iris_tdt %.% group_by(Species) %.% summarise(avg_petal_width = mean(Petal.Width)) avg_petal_width 1 1.199333 这用于输出一个包含物种和avg_petal_width的表。现在，似乎删除了物种列，并将avg_petal_width聚合为单个值。group_by似乎在工作，所以我猜这是总结的一个问题。 grp <-

浏览 0提问于2014-03-11得票数 2

回答已采纳

2回答

汇总可变数量的列

r、sparklyr

我有一个spark数据框架(在R和sparklyr的上下文中)，它有三列: id、x和y。 df <- df %>% group_by(id) %>% summarize(x=sum(x),y=sum(y)) 现在假设我现在接收到一个列数可变的数据帧。除了id之外，所有其他列都是双精度的，我需要像以前一样对它们进行总结。当然，我可以得到列名，迭代汇总每个列名并连接结果，但它看起来很难看。有没有一种简单的方法呢？

浏览 3提问于2018-05-17得票数 0

1回答

如何使用一个循环来将多个变量值的数据帧切片，并在r中创建多个统计汇总()

r、loops、dplyr

我试图从一个数据帧获得多个汇总()输出。我要根据某些特征多次进行子集。然后获取每个片段的某个变量的汇总()，并将所有汇总()输出放在一个dataframe或一个列表中。理想情况下，我希望获得用于分割数据的每个building_id的名称，作为该汇总()行的名称。所以我想使用for循环。这些数据足够大(大约20米线)，我使用的是building_metadata数据和列车数据，这是kaggle 的ashrae能量预测中的一个。我已经创建了一个tibble，它保存了我想要的子集的构建i。我想得到变量"energy_sqm“(我已经创建了)的摘要()，所以我尝试将这个切片放在一个for

浏览 1提问于2020-07-11得票数 1

回答已采纳

1回答

R-如何正确使用组的功能

r、dplyr

我试着做一些按性别排序的变量的平均值和相关性。由于某种原因，我认为我的group_by函数不起作用。 data(PSID1982, package ="AER" ) PSID1982 %>% group_by(gender) %>% summarise(avgeduc = mean(PSID1982$education), avgexper = mean(PSID1982$experience), avgwage= mean(PSID1982$wage),cor_wagvseduc = cor( x=PSID1982$wage, y= PSID1982

浏览 2提问于2019-10-05得票数 0

2回答

动态变量R中的dplyr摘要

r、dplyr

我试图在R中使用汇总和分组，但是，当我使用一个变量代替显式调用汇总列时，它对每一行的整个数据集使用dist之和，而不是正确地分组。这可以很容易地从下面的TestBad和TestGood之间看出。我只想能够使用GraphVar变量复制TestGood的结果，就像在TestBad中一样。 require("dplyr") GraphVar <- "dist" TestBad <- summarise(group_by_(cars,"speed"),Sum=sum(cars[[GraphVar]],na.rm=TR

浏览 2提问于2016-08-31得票数 6

回答已采纳

4回答

使用变量名称的多列的dplyr - groupby

r、group-by、shiny、dplyr

我正在与R光泽进行一些探索性的数据分析。我有两个复选框输入，其中只包含用户选择的选项。第一个复选框输入仅包含分类变量；第二个复选框仅包含数字变量。接下来，我对这两种选择应用groupby： var1 <- input$variable1 # Checkbox with categorical variables var2 <- input$variable2 # Checkbox with numerical variables v$data <- dataset %>% group_by_(var1) %>% summarize_(

浏览 3提问于2015-12-28得票数 45

回答已采纳

2回答

dplyr等同于plyr菱形中的ddply示例

r、plyr、dplyr

好的，我试着用dplyr来代替plyr。在我使用R的短暂时间里，我已经有点习惯了ddply。我使用了一个“简单”的例子来说明如何在plyr中使用dplyr而不是ddply。如下所示： t1.table <- ddply(diamonds, c("clarity", "cut"), "nrow") 我收到了一个按清晰度和切割度计算的钻石总数汇总表。在dplyr中，我能想到的最简单的例子是： diamonds %>% select(clarity, cut) %>% group_by(clarity, cut) %>%

浏览 2提问于2014-09-11得票数 6

1回答

使用For循环进行数据聚合

r、transform、data-cleaning

我有一个数据集，其中包含每支球队17年来每个篮球运动员的统计数据。在R中，我试图通过使用for循环将这些球员级别的观察转换为团队级别的观察(每年)，该循环遍历年份和球队，然后汇总前三名得分手的个人统计数据(得分、助攻、篮板等)。你建议我如何继续？(在下面你会发现我目前的尝试，它只从数据集的最后一支球队和年份中提取观察数据，而不能从前三名中提取其他统计数据，如助攻和篮板数)。 for (year in 2000:2017) { for (team in teams) { ts3_points =top_n(select(filter(bball, Tm == team & Yea

浏览 0提问于2019-10-25得票数 0

2回答

dplyr _1 ()中不需要的摘要

r、dplyr

下面是dplyr中的一个汇总表的示例： library(dplyr) category <- c('A', 'A', 'A', 'B', 'B') col1 <- c(1, 1, 0, 0, 1) col2 <- c(1, 0, 1, 1, 1) tbl <- as_tibble(data.frame(category, col1, col2)) sum_tbl <- tbl %>% group_by(category) %>% summarize(a

浏览 12提问于2021-07-10得票数 0

回答已采纳

1回答

在dplyr：：汇总中将级联的字符串作为列名传递

r、dplyr、concatenation、paste、summarize

我正在尝试以迭代的方式执行dplyr汇总，使用连接字符串作为列名。 Category=c("a","a","b","b","b","c","c","c") A1=c(1,2,3,4,3,2,1,2) A2=c(10,11,12,13,14,15,16,17) tt=cbind(Category,A1,A2) tdat=data.frame(tt) colnames(tdat)=c("Category","M1","M2"

浏览 1提问于2020-12-18得票数 1

回答已采纳

1回答

Group_by (dplyr)，其中一个因子作为列

r、dplyr、grouping、summarization

在下面的虚拟数据集中，我想创建一个按三个变量分组的汇总表。到目前为止，我使用的是dplyr。但是，我希望将r的值作为列名，将x1和x2值作为行名，并使用来自m的值填充相应的单元格。 r <- rep(seq(1,10,1),10) x1 <- rbinom(100, 1, 0.5) x2 <- rbinom(100, 2, 0.5) y <- rnorm(100, 10, 5) df <- data.frame(r,x1,x2,y) library(dplyr) View(df %>% group_by(x1,x2,r) %>% s

浏览 11提问于2019-01-25得票数 0

回答已采纳

1回答

在R个汇总数据帧中添加关于一个因子的比例

r、summarize

我已经使用R的“汇总”功能创建了一个汇总数据框架，包括两个因素-“公司大小”和“案例状态”-以及“公司大小”和“案例状态”的每个组合的记录数(n)。公司的大小有三个级别，案例状态有四个级别，所以我在这个汇总的数据框中总共有12行。下面是汇总数据框的脚本(包括前面的'group by‘函数)： df <- group_by(df, df$Firm.Size, df$`Case Status`) summ_firm <- summarize(df, num_records = n()) 我想在汇总数据框架中创建一个新列，该列提供单个行的记录数(即给定的“公司大小”和“案例状态”

浏览 0提问于2018-02-28得票数 0

2回答

dplyr和r中的for循环

r、for-loop、dplyr

所以问题来了:我想在R代码中使用for循环来汇总不同的列。作为一个例子，下面是它可能的样子： all.columns<-c("column4","column5","column6","column7") for (i in 1:4) { df%>% group_by(column3)%>% summarise(Mean=mean(all.columns[i]), Max=max(all.columns[i])) } 其中df是一个数据框，column3可以是一个group by

浏览 0提问于2015-09-01得票数 4

回答已采纳

1回答

是什么导致了这个sqldf错误--需要按Customer_ID分组？

r、sqldf

我目前在R中有一个名为DDS_LS的数据帧。目前，每一行都是按事务处理的，但我需要按Customer_ID汇总事务。 sqldf("SELECT Customer_ID, count(distinct Lifestyle), count(distinct Price_Point), cumsum(Delivered_Sales), cumsum(QTY_sold) FROM DDS_LS GROUP BY Customer_ID") 然后我得到以下错误： Error in rsqlite_send_query(conn@ptr, stateme

浏览 0提问于2017-08-18得票数 0

2回答

应用group_by和sum(Sum)，但保留大量附加列

r、dplyr

我想通过一个变量对我的数据框进行分组，汇总另一个变量，但保留所有其他相关列。在Applying group_by and summarise on data while keeping all the columns' info中，公认的答案是使用filter()或slice()，如果答案已经存在于数据中(即min，max)，则可以很好地工作，但如果您想要使用生成新答案(即sum，mean)的函数，则此方法不起作用。在Applying group_by and summarise(sum) but keep columns with non-relevant conflictin

浏览 18提问于2020-06-23得票数 3

回答已采纳

3回答

R中总结柱的相对频率

r、dplyr、group-by、percentage、summarize

我需要得到R中一个汇总列的相对频率，我使用了dplyr的汇总来查找每个分组行的总数，如下所示： data %>% group_by(x) %>% summarise(total = sum(dollars)) x total <chr> <dbl> 1 expense 1 3600 2 expense 2 2150 3 expense 3 2000 但是，现在我需要为每一行

浏览 10提问于2021-12-29得票数 2

回答已采纳

1回答

以最有效的方式确保dplyr::summarise()中的唯一值

r、dplyr、unique、paste

我通常有一个有很多character类型的列(在20到30之间)和只有3-4个类型的numeric列的tibble。对数字列进行分组和汇总非常快，但我在确保每个分组var值具有唯一值的同时汇总字符列的方法总体上相当慢。我只是想知道有没有比使用paste()更快的方法。 library(magrittr) make_unique <- function(x, sep = "-") { ifelse(length(x_unique <- unique(x)) == 1, x_unique, paste(sort(x_unique), collapse

浏览 24提问于2019-04-05得票数 1

回答已采纳

2回答

R:计算每个类别的观察次数

r、dataset、preprocessing、counts

我目前从R开始，想知道如何从下面的数据集中计算每天每个节点每个复制的观察次数，并将其存储在不同的数据集中。原始数据集如下所示： 📷 希望生成的数据集如下所示： 📷 有人能帮我找出我怎么能在R里做到这一点吗？谢谢

浏览 0提问于2020-07-02得票数 1

1回答

根据标准总结两行之间的值

r、dplyr、sum、row、mutate

我有这个数据在“年龄”列中的值需要根据整个大小范围进行汇总，即现在的数据框架如下所示： Size Age 1 Age 2 Age 3 [1] 8 2 8 5 [2] 8.5 4 7 9 [3] 9 1 11 45 [4] 9.5 3 2 0 但我想要这个 Size Age 1 Age 2 Age 3 [1+2] 8 6 15 16 [3+4] 9 4

浏览 2提问于2022-11-18得票数 1

2回答

如何在R中创建多个循环？

r、loops

我正在使用一个国家的每日死亡人数数据库，因此我需要创建一个数据库，其中包含按日、月和州划分的每日死亡人数的汇总数据。我的数据库(def_2020)是这样的： |--------------|------------|-------| | State | Month | Day | |--------------|------------|-------| | state1 | jan | 1 | |--------------|------------|-------| | state1 | jan |

浏览 20提问于2020-11-17得票数 0

回答已采纳

1回答

在基于粘合的格式设置中结合使用dplyr summarise()和across()时，不会生成预期的列名

r、dplyr、tidyverse

在R中，我试图通过计算多个汇总统计信息来聚合多个列。我还想在across()函数中使用.names参数，因为结果tibble对象具有列名，其中包含有关所使用的摘要函数的信息。我试过了 library(tidyverse) library(palmerpenguins) penguins_stats <- penguins %>% dplyr::group_by(species) %>% dplyr::summarise(across(.cols = ends_with("mm"), .fn

浏览 21提问于2020-11-28得票数 0

回答已采纳

3回答

错误：`n()`只能在dplyr谓词中使用

r、dplyr

运行R 4.0.2和dplyr 1.0.2 我正在尝试在srvyr对象上的汇总调用中使用n = n()： relduration_by_age_grp <- l %>% filter(ongoing == 0 & ptype == i) %>% select(ego.id, ptype, age.grp, ego.age.grp, duration, ego.wawt) %>% mutate(min.age.grp = ifelse(age.grp < ego.age.grp,

浏览 3提问于2020-08-27得票数 6

回答已采纳

2回答

在同一列中聚合事件

r、aggregate

我有个愚蠢的问题。我正在尝试按位置(字段)汇总同一周内的事件总数(Year_Week)。下面的表格屏幕截图类似于我的csv文件。我已经能够使用以下代码按字段和字段对分数求和: aggregate(x =df$ Year_Week，by = list(df$Year_Week，df$ Field )，FUN = sum) ? 但是，我不确定如何根据Year_Week和字段对事件进行求和。例如，由于2019-4赛季在欧文发生了2场比赛，我希望我的输出显示为"2“。同样，因为有三场比赛发生在2019-2赛季的那一周，所以我希望我的输出显示为"3“。我希望我的输出表看起来像这

浏览 22提问于2021-08-15得票数 1

1回答

R中对象的S3汇总方法

我是R的新手，我有一个问题，我一直在努力解码我需要做的事情。“为WeatherData类的对象编写一个S3汇总方法，该方法生成按季节划分的rain，maxtp，mintp，maxgt变量的统计汇总:平均值，标准差，最小值，最大值。忽略计算中缺少的值”。我处理的对象包含从1941年11月到2019年5月在都柏林机场́大都会气象站记录的历史月度数据。(来源：)。我该如何继续呢？

浏览 11提问于2019-11-06得票数 0

3回答

按函数内的变量进行分组和汇总

r、plyr

如何使用ddply对变量进行分组并进行汇总？例如： library(plyr) sample <- function(x, g){ print(g) print(x[[g]]) res = ddply(x, ~x[[g]], summarise, value = mean(value)) return(res) } x = data.frame(type = c('a', 'a', 'a', 'b'), age = c(20, 21, 21, 10),

浏览 2提问于2017-08-02得票数 1

回答已采纳

4回答

如何使用group_by()对()数据进行反应式的汇总？

r、shiny、dplyr

我正在构建一个闪亮的web应用程序，允许用户在不使用R代码的情况下充分利用dplyr (数据争用和操纵R包)。我希望group_by()和summarise()分别使用一个selectInput，它允许在“电影”文件()中的所有可用变量中选择一个变量。有人知道怎么解决这个问题吗？当使用以下服务器功能时，我得到一个空表. shinyServer(function(input, output){ output$table <- DT::renderDataTable({ moviesSummarise <- movies %>% g

浏览 0提问于2019-08-13得票数 0

回答已采纳

4回答

将列名作为字符串传递给group_by和summarize

r、dplyr、summarize、rlang、quosure

随着dplyr从0.7版本开始，以下划线结尾的方法，比如summarize_，quosure，已经被弃用了，因为我们应该使用group_by_。请参阅：https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html 我正在尝试使用quo和!！来实现下面的示例。工作示例： df <- data.frame(x = c("a","a","a","b","b","b"), y=c(1,1,2,2,3,3), z

浏览 82提问于2017-10-25得票数 11

回答已采纳

1回答

功能..。故障(编码器！)，包括group_by和导出

r、function

在R中，我试图将下面的代码转换为一个函数(使用参数变量而不是性别)。 res_gender <- payments %>% group_by(yrmon,gender) %>% summarise_at(vars(nbpol,nbtrans,member_revenue,untenm,untem), list(name = sum)) write.table(res_gender, file="gender.csv",sep=",",row.names=F) 以下是我的尝试(第一部分

浏览 1提问于2020-12-01得票数 0

1回答

如何对R中不同变量组的聚类结果进行统计汇总

r、group-by、cluster-analysis

我想知道是否有一个软件包或快速方法来为聚类结果生成统计汇总表。我想我可以选择感兴趣的变量并按聚类编号分组，然后计算平均值和最大值等。我正在寻找一种快速的方法来做到这一点。有没有我可以用的包？谢谢

浏览 19提问于2020-09-09得票数 0

回答已采纳

1回答

通过在R中创建一个用户定义的函数来准备数据

r、dplyr

我希望使用R和package dplyr来准备或总结一列值，使用带有用户定义函数的汇总(在dplyr中)，或者手工定义它。但是，数据没有在指定的组上聚合。有关详情，请参阅以下短文。提供了所需的结果。 library(dplyr) ver="dplyr version 1.0.5" #create user defined function intended for summarise() myfun=function(values){ values^2} 进口数据 df=data.table( grp=c("x","x","y&

浏览 2提问于2021-07-11得票数 0

回答已采纳

2回答

用惯用的dplyr和/或data.table方法一步一步地得到组的意思和宏大的意思。

r、dplyr、data.table

我同时使用dplyr和data.table，所以我感兴趣的是是否有使用任何一个包的解决方案。我通常希望用摘要统计来总结数据--比如说，为了示例--通过一些分组变量和整个数据集(大平均值)来总结数据。然后，我通常将它们组合成一个输出数据，以供显示，分组变量列中的大平均值行指定为“总计”或“总体”。以下是我通常是如何使用dplyr和data.table实现的德普利 library(dplyr) d <- tibble(grp = rep(letters[1:3], 10), v = 1:30) group_means <- d %>% group_by(grp) %

浏览 3提问于2022-04-01得票数 1

回答已采纳

2回答

如何按组查找合计？

我正在尝试通过计算总数来按组汇总一些数据。 library(hflights) head(hflights) hflights_df <- tbl_df(hflights) hflights_df$ActualElapsedTime<-as.numeric(hflights_df$ActualElapsedTime) hflights_df %>% group_by("Year", "Month") %>% sum(ActualElapsedTime, na.rm=T) function_listk中出错:找不到对象'Ac

浏览 0提问于2018-04-16得票数 1

1回答

基于另一个具有条件的数据填充

我在R上是新的，我有一个22x252的数据集，252在第1(ID)列上有许多重复的值。我创建了另一个数据集，该数据集具有唯一值的n行(这些值已经被填充)，我希望根据其他数据集填充其余的列(基本上是将所有在第1列中共享相同值的值加起来)。有什么基本功能可以让我做到这一点吗？致谢和问候

浏览 1提问于2020-05-31得票数 0

回答已采纳

2回答

为dplyr使用组名和摘要部分中的Alias列名

r、dplyr

我有一个dataset，其中我想简单地为列名使用别名，并将其应用于dplyr group_by/汇总函数。下面是一个例子。 alias = 'cust' alias2 = 'class' df <- data_frame(cust = c("A", "B", "A", "C", "B"), class = c(1, 2, 3, 4, 7)) df cust class <chr> <dbl> 1 A

浏览 0提问于2018-07-31得票数 0

回答已采纳

1回答

我可以让重命名接受一个函数作为新的变量名吗？

r、dplyr、rename

我有一个数据集，并希望通过教育和种族创造一个时间序列的手段。但是，我很难让rename()接受一个命令，而不仅仅是一个字符串作为一个新的变量名。我的代码： #libraries install.packages(c("tidyverse", "spatstat")) lapply(c("tidyverse", "spatstat"), require, character.only = TRUE) #calculate weighted medians by race and education wmedians <-

浏览 3提问于2021-03-17得票数 0

回答已采纳

2回答

总结一种方法，然后用另一种方法总结剩下的内容

r、dplyr、summarize

以iris为例。在按Species分组之后，我想按其mean汇总Sepal.Length，然后按last汇总所有剩余的列；(不单独调用其余的列。)想要结果 # A tibble: 3 x 5 Species Sepal.Length Sepal.Width Petal.Length Petal.Width <fct> <dbl> <dbl> <dbl> <dbl> 1 setosa 5.01 3.3

浏览 16提问于2020-06-11得票数 0

回答已采纳

1回答

如何根据主数据框中所选要素生成动态汇总表

r、dataframe、dplyr

嗨，我有一个数据框架，它是聚类的结果。示例如下： ave_remark_best ave_price_per_sqft ave_age ave_DOM ave_activity_rate cluster 1006332 1.00000000 1419.6900 12.0000000 7.000000 1.0000000 3 1010660 1.00000000 912.1800 7.0000000 10.000000 1.0000000 3 1012960

浏览 18提问于2021-03-02得票数 0

回答已采纳

2回答

生成R中的条件摘要统计量？

r、dataframe

我对这个相当简单的问题表示歉意，因为尽管我在计量经济学/回归分析方面有一些R方面的经验，但我还是设法跳过学习如何在R中创建基本的汇总统计数据，如何生成一个输出来计算该特定数据的观察数。对于此数据，如何计算特定列的每种类型的不同数目(即：“侧”列中有多少个L和Rs )？如果“侧”列等于“L”(例如，当'Side‘等于'L’时，绿色、红色或蓝色的百分比是多少？ Side State Color Type L O Green B R C Red Q R O

浏览 3提问于2020-10-03得票数 0

回答已采纳

1回答

平均R个对象

r、object、lapply

假设我有几个R对象，例如lm输出： m1 <- lm(x ~ y, data = data, subset = sample==1) m2 <- lm(x ~ y, data = data, subset = sample==2) m3 <- lm(x ~ y, data = data, subset = sample==3) m4 <- lm(x ~ y, data = data, subset = sample==4) 现在我想对这些对象求平均，即我想对lm产生的所有估计值求平均。如果我能得到对象中所有参数的汇总统计信息，即平均截距等，我将非常高兴。简化问题的是，所

浏览 4提问于2014-12-02得票数 0

3回答

dplyr:组均值对中(变异+汇总)

r、dplyr

做组的有效/首选方法是什么，这意味着以dplyr为中心，即获取组的每个元素(mutate)并对其执行操作，并为该组执行汇总stat (summarize)。下面是如何实现组的意思是使用基R以mtcars为中心： do.call(rbind, lapply(split(mtcars, mtcars$cyl), function(x){ x[["cent"]] <- x$mpg - mean(x$mpg) x }))

浏览 5提问于2015-04-11得票数 2

回答已采纳

2回答

dplyr::group_by()或just > group_by()

r、dplyr、group-by、operators

我进入了编程语言R，我想知道dplyr::group_by()和group_by()之间的区别?这个操作符“：”做什么？谢谢!

浏览 9提问于2022-05-01得票数 0

1回答

带绘图的闪亮仪表板

shiny、shinydashboard

我正在学习一些闪亮的，以便做一个仪表盘。我有个主意。我想创建一个仪表板，从选择中选择一个变量，按这样的变量分组，并绘制变量总数的条形图或直方图。我已经生成了一个样本数据集来生成我需要的内容，但是我无法获得我需要的内容。下面是UI代码： library(shiny) shinyUI(fluidPage( titlePanel("Demo dashboard"), sidebarLayout( sidebarPanel( selectInput("variable", "grou

浏览 2提问于2018-12-20得票数 0

2回答

R移除按因子分组的数据中的异常值

r、dataframe、outliers

我有一个包含三个参数(按样本分组)的测量数据： ORD curv exp rep mu lam abs 1 Combi pH=7 Curva_F_Cor Exp_F Rep1 0.15637365 714.947.305 0.4990000 2 Combi pH=7 Curva_F_Cor Exp_F Rep10 0.12817901 6.797.925.883 0.4914276 3 Combi pH=7 Curva_F_Cor Exp_F Rep11 0.13392221 6.765.638.528 0.52

浏览 1提问于2017-06-24得票数 3

回答已采纳

1回答

如何使用dplyr R跨多个列应用摘要

r、group-by、dplyr、sum、summarize

我有一些电动汽车充电能力预测从2019年至2050年不同地区和充电器类型。我想按充电器类型对整个区域和组的值进行汇总，如下所示： df %>% group_by(ChargerType) %>% summarise(sum2019 = sum(df$`2019`)) 但我想从2019年到2050年一直这么做。这可以单独完成，但将是非常乏味的，我相信有一个很好的方法来做这一切在一个！供您尝试的示例数据可以如下所示： Area <- c(1,1,1,2,2,2,3,3,3) ChargerType <- c("Domestic", "Pub

浏览 1提问于2020-08-14得票数 1

回答已采纳

3回答

当组不是NA时的汇总统计信息

r、data-wrangling

我想计算第1组、第2组和第3组的重量和高度汇总统计数据(平均，范围)。我特别想通过计算当第1组不为NA (对于calc组1)时计算汇总统计量来实现这一点，而对于第2组，当列不是NA时，我想要通过计算汇总统计量来实现这一点。在下面的例子中，第1组的权重为3,2，第2组的权重为3,5。 dt <- tibble( group1 = c(1, 1, NA, NA, NA, NA), group2 = c(NA, NA, 2, 2, NA, NA), group3 = c(NA, NA, NA, NA, 3, 3), weight = c(3, 2, 3, 5, NA, 7),

浏览 0提问于2021-08-28得票数 1

回答已采纳

2回答

如何在dplyr的group_by上使用if/ifelse

r、dplyr

有没有什么方法可以应用条件group_by？例如(顺便说一下，代码不能工作，但它只是为了显示虹膜数据集，这样你就能理解要点了)： iris$Sepal.Width.r <- round(iris$Sepal.Width) for(i in 1:2){ test <- iris %>% ifelse(i == 1, group_by(Species), group_by(Sepal.Width.r)) %>% #**** summarise(avgLWdiff = (mean(Petal.Length) - mean(Petal.Width))) prin

浏览 28提问于2021-07-25得票数 2

回答已采纳

1回答

范畴变量的聚合

aggregation

我希望聚合我的数据库，包括分类变量，以便每行表示来自原始数据的多个行(例如，基于学生ID)。每个列都需要保存原始数据中最常见的值(每个聚合ID)。示例:我希望按学生汇总数据，并查看最常见的分类变量级别--例如： student class a h (being h the dominant level for the variable "class" 我在R工作室工作

浏览 0提问于2019-01-02得票数 0

回答已采纳