将列名作为字符串传递给group_by和summarize_R将列名传递给函数，而不是作为字符串_将证书和密钥作为字符串传递给ListenAndServeTLS - 腾讯云开发者社区

r、dplyr、rlang

Dplyr0.7的发布包含一个用dplyr编程的。我仔细阅读了本文档，并试图了解它将如何影响我对dplyr的使用。下面是我在使用dplyr构建报告和聚合函数时使用的一个常见成语： my_report <- function(data, grouping_vars) { data %>% group_by_(.dots=grouping_vars) %>% summarize(x_mean=mean(x), x_median=median(x), ...) } 在这里，grouping_vars是字符串的向量。我喜欢这个成语，因为我可以从其他地方传入字符

浏览 9提问于2017-04-14得票数 24

回答已采纳

2回答

此函数(R)有什么问题(初学者)

r、function、dplyr

我正在尝试创建一个函数，该函数自动在具有感兴趣的列(y)的特定数据帧(x)上执行dplyr的group_by和summarize命令。我写的代码是： mysummary <– function(x, y){ k = x %>% group_by(x$y) %>% summarize(col.name = mean(var.name)) return(k)

浏览 34提问于2020-06-27得票数 1

回答已采纳

1回答

具有未知长度变量列表的R函数

试着把学到的R分出来，我在工作中经常做的一件事是，我用特定时间的周期变量拉出加权方法。我想出了如何像这样单独做到这一点： means_by_period <- df %>% group_by(period) %>% summarize(var1 = weighted.mean(var1, wgtvar), var2 = weighted.mean(var2, wgtvar), var3 = weighted.mean(var3, wgtvar), var4 = weighted.mean

浏览 4提问于2020-06-24得票数 1

回答已采纳

2回答

用于循环输出错误的答案

r、function、loops

下面的代码就是一个例子。我的函数testf在单独调用NAME或SRC时工作得很好，但是如果我试图通过一个向量来实现它，它就不起作用了--我相信这是有意义的。所以我冒险让它成为一个循环(据我所理解)，它应该能工作，但它没有。它产生了一个输出，但它显然是错误的，我不知道它为什么要这样做。我是不是不正确地运用这个？谢谢 NAME <- c("SYNOP", "SYNOP", "METAR", "METAR", "SYNOP", "METAR") AIR <- c(6.7, 8.3, 9.2,

浏览 2提问于2016-09-15得票数 0

回答已采纳

2回答

如何按组循环遍历日期变量名称和和？

r、dplyr

我有一些时间序列数据，其中有几个区域变量，其余的变量名都是日期。我试图循环遍历整个日期变量列表，并对每个变量进行求和，但不确定如何使用dplyr语法来实现。到目前为止，这就是我所拥有的 library(dplyr) library(lubridate) library(data.table) library(curl) # county level covid_jhu <- as.data.frame(fread(paste0("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid

浏览 2提问于2020-04-15得票数 0

回答已采纳

1回答

我可以让重命名接受一个函数作为新的变量名吗？

r、dplyr、rename

我有一个数据集，并希望通过教育和种族创造一个时间序列的手段。但是，我很难让rename()接受一个命令，而不仅仅是一个字符串作为一个新的变量名。我的代码： #libraries install.packages(c("tidyverse", "spatstat")) lapply(c("tidyverse", "spatstat"), require, character.only = TRUE) #calculate weighted medians by race and education wmedians <-

浏览 3提问于2021-03-17得票数 0

回答已采纳

1回答

在dplyr：：汇总中将级联的字符串作为列名传递

r、dplyr、concatenation、paste、summarize

我正在尝试以迭代的方式执行dplyr汇总，使用连接字符串作为列名。 Category=c("a","a","b","b","b","c","c","c") A1=c(1,2,3,4,3,2,1,2) A2=c(10,11,12,13,14,15,16,17) tt=cbind(Category,A1,A2) tdat=data.frame(tt) colnames(tdat)=c("Category","M1","M2"

浏览 1提问于2020-12-18得票数 1

回答已采纳

2回答

与dplyr一起使用粘贴命令

r、dplyr

为了将字符串的某些部分从dyplyr粘贴到命令group_by中，我尝试使用粘贴命令。这是如何看起来像代码一般没有粘贴。 library(dplyr) DATA1<-DATA%>% dplyr::group_by(id_n,gross_income)%>% dplyr::summarize(gross_i=sum(gross_i) 所以现在我想使用粘贴命令，我尝试使用这一行代码。 query_type1<-"id_n,gross_income" 下一步是在上面的代码中实现这一行代码。 DATA1<-DATA%>% dplyr:

浏览 5提问于2021-01-12得票数 0

回答已采纳

4回答

使用变量名称的多列的dplyr - groupby

r、group-by、shiny、dplyr

我正在与R光泽进行一些探索性的数据分析。我有两个复选框输入，其中只包含用户选择的选项。第一个复选框输入仅包含分类变量；第二个复选框仅包含数字变量。接下来，我对这两种选择应用groupby： var1 <- input$variable1 # Checkbox with categorical variables var2 <- input$variable2 # Checkbox with numerical variables v$data <- dataset %>% group_by_(var1) %>% summarize_(

浏览 3提问于2015-12-28得票数 45

回答已采纳

1回答

在summarize()中使用group_by()的语法

r、syntax、dplyr、pipe、summarize

如何在summarize()中使用group_by()函数，如下所示： summarize(group_by(product),sum(Sales))

浏览 0提问于2016-11-08得票数 0

2回答

如何按组计算所有变量的标准误差

r、dataframe、dplyr、rows、standard-error

我有dataframe包含变量： Group high weigh age col5 row1 A 12 57 18 AA row2 C 22 80 29 BB row3 B 17 70 20 CC row4 A 13 60 26 DD row5 D 19 69 25 AA row6 B 10 15 19 BB row7 C 20 66 22 CC row8 D

浏览 8提问于2022-04-13得票数 0

2回答

为什么商在group_by()中工作，而不是filter()呢？

r、dplyr、nse

我正在构建一个基于字符串操作数据框架的函数。在函数中，我将从字符串构建一个列名，并使用它来操作数据框架，如下所示： library(dplyr) orig_df <- data_frame( id = 1:3 , amt = c(100, 200, 300) , anyA = c(T,F,T) , othercol = c(F,F,T) ) summarize_my_df_broken <- function(df, my_string) { my_column <- quo(paste0("any", my_stri

浏览 5提问于2017-10-12得票数 4

回答已采纳

1回答

如何修复‘ValueError(“输入必须有多个句子”)’错误

python-3.x、beautifulsoup、gensim

我正在写一个脚本，需要一个网站的网址，并使用美丽的汤下载它。然后它使用gensim.summarization来总结文本，但是我一直得到ValueError(“输入必须有多个句子”)，即使文本有多个句子。脚本的第一部分下载文本，但我无法获得第二部分来总结文本。 import bs4 as bs import urllib.request from gensim.summarization import summarize from gensim.summarization.textcleaner import split_sentences #=======================

浏览 12提问于2019-02-07得票数 2

1回答

sdf_bind_rows(a，b) %>% group_by(col1，col2) %>% sumarize(n=n())崩溃Spark和R

apache-spark、dplyr、sparklyr

注意:问题1发布在上。交叉发布看看我在这里是否有更好的运气。我正在尝试合并(rbind)两个数据集，并从合并后的数据集中删除重复项。这已经生成了一系列错误，我可以在本例中重现其中之一：可重现错误码： #install.packages("dplyr") #install.packages("dbplyr") #install.packages('sparklyr') library(dplyr) library(dbplyr) library(sparklyr) #spark_install(version = "2.1.0"

浏览 5提问于2019-08-06得票数 0

1回答

在R中总结(n())和count()难度

r、dplyr、count、summarize

这个问题快把我逼疯了，我搞不清楚。下面是我的dataframe (df)的一个子集，可以让事情变得更简单。我想在group_by上做爱，然后算一下总数。简单？ df %>% group_by(sex) %>% count() 此代码返回以下输出我想要的(以及我认为这段代码在我以前使用它时所做的事情(可能是我的记忆力不好)是这样的输出我使用以下命令获得此输出 df %>% group_by(sex) %>% tally() 我并不反对tally()，但我发誓我之前使用的是count()。另外，我想我可以使用group_by %>

浏览 0提问于2020-10-29得票数 0

1回答

在给定R中多个列的值输入的情况下，编写一个函数以输出最小值、平均值和最大值

r、function、output

我有3个变量(A、B和C)，每个变量包含10个值(每行1个值)，我想为每个变量创建一个范围(输出)或三列。基本上，给定A、B和C的10个值，我想自动输出R中每个变量的最小值、平均值和最大值。我在考虑使用一个函数，我的输入是这三个变量。我使用了excel，但是一旦我得到了更多的数据，我就会遇到输出值的问题。我使用了一个条件语句并手动输入了值--我想为每个变量创建三个对应于每个范围(Min、Avg和Max)的新列。 #Create a DataFrame ## Random Matrix - Three Variables - 50 rows ## trial <- matrix(sam

浏览 24提问于2019-09-09得票数 1

回答已采纳

1回答

将Spark函数转换为“普通”R代码

r、dplyr、sparklyr

我正试着遵循一个小题大作“如何制造马尔可夫链”()。本教程很有趣，因为它使用的数据源与我使用的数据源相同。但是，是代码的一部分，它使用的是"Spark代码“(我从上一个问题中得到的内容)。我的问题是:我在谷歌上搜索了很多，并试图自己解决这个问题。但是我不知道怎么做，因为我不知道数据应该是什么样子(作者在函数前后没有给出他的DF示例)。如何将这段代码转换为“正常”R代码(不使用火花)(特别是: concat_ws & collect_list函数正在给带来麻烦他正在使用这一行代码： channel_stacks = data_feed_tbl %>% group_

浏览 0提问于2018-10-16得票数 0

回答已采纳

4回答

汇总同一调用中的所有组值和条件子集。

r、dplyr、sqldf

我将举例说明我的问题。样本数据： df <- data.frame(ID = c(1, 1, 2, 2, 3, 5), A = c("foo", "bar", "foo", "foo", "bar", "bar"), B = c(1, 5, 7, 23, 54, 202)) df ID A B 1 1 foo 1 2 1 bar 5 3 2 foo 7 4 2 foo 23 5 3 bar 54 6 5 bar 202 我要做的是，用ID来

浏览 9提问于2014-05-07得票数 68

回答已采纳

1回答

将data.frame列名传递给函数

r、tidyverse

我看到类似的文章提到需要使用引号将列名传递给函数，但我可以在错误的地方和如何改进函数方面寻求帮助。例如，也许我可以添加一个“后缀”参数来自动为新的data.frame分配原始名称的后缀名？我希望能够有一个泛型函数，我可以使用它来改变列名和位置。谢谢。 library(tidyverse) # function definition # createhrly_0595quants <- function(df, hourcolumn, value, qtype, metadata_to_add) { df <- df %>% group_by(ho

浏览 1提问于2018-11-20得票数 1

回答已采纳

1回答

在这种情况下，如何在中传递输入值？

r、ggplot2、dplyr、shiny、magrittr

--如果我在本例中运行我的代码，它可以工作，知道输入还没有被传递。--代码简单地将数据从data.csv中提取出来。此数据框架有许多列( code、vaccinationsTotal、peopleFirstTotal、peopleFullTotal、peopleBoosterTotal )，我要做的只是通过input$sel选择列 library(shiny) library(dplyr) library(ggplot2) library(magrittr) library(readr) dataf <- read_csv("data.csv") server &

浏览 3提问于2021-12-17得票数 0

回答已采纳

1回答

为什么dplyr包中的选定变量不在R中的输出df中？

r、select、dplyr、output

我有一个有30列和2000行的df。在df中，我根据变量的名称选择了几个变量，并通过3行组和类型变量的by3行计算了值的平均值。但是输出数据中只有3个变量(组、类型、res)。如何告知如何将选定的变量保存到输出df中？这个代码有什么问题吗？ output <- data %>% select(group, type, A, B, C, Value) %>% group_by(group = gl(n()/3, 3), type) %>% summarise(res = mean(Value)) 提前感谢！

浏览 0提问于2019-04-29得票数 1

回答已采纳

1回答

用dplyr语法编写可调用函数，使用enquo()，不返回预期输出

r、dplyr、lazy-evaluation、tidyr

library(tidyverse) library(stringr) library(janitor) word_count <- function(data, char_col) { char_col <- enquo(char_col) data %>% select(!!char_col) %>% mutate(char_col = str_remove_all(!!char_col, '[[:punct:]]')) %>% mutate(char_col = str_split(!!char_c

浏览 1提问于2018-05-31得票数 3

回答已采纳

1回答

使用R中的group_by函数按位置调用数据帧的列

r、list、dataframe、time、dplyr

我想为每天的流数据计算出每年的月平均值。为此，我使用了函数group_by和summarize。这是我的意见：这是我的密码： x[[1]] %>% group_by(year, month) %>% summarize(mean.value = mean(x[[1]][[2]])) 我认为我的问题是当我使用DailyPrec函数计算数据帧( mean )第二列的平均值时。我得到的输出是：当我使用列名时： x[[1]] %>% group_by(year, month) %>% summarize(mean.value = mean(DailyPrec

浏览 2提问于2021-05-23得票数 1

回答已采纳

2回答

将data.table的列(名称和值)传递给函数

r、function、data.table

我想编写一个简单的函数来计算Var1的平均值： data<-structure(list(time = structure(c(1358832600, 1358832600), class = c("POSIXct", "POSIXt"), tzone = ""), Var1 = c(0.4, 0.2)), .Names = c("time", "Var1"), row.names = c(NA, -2L), class = "data.frame") data<- data.ta

浏览 3提问于2015-09-15得票数 3

回答已采纳

2回答

使用汇总和for循环从字符向量中提取列名。

r、for-loop、dplyr、summarize

我有一个不能在这里共享的数据集，但是我需要使用for循环创建列，列名应该来自字符向量。下面，我尝试使用来自nycflights13包的航班数据集来复制我想要实现的目标。 install.packages("nycflights13") library(nycflights13) flights <- nycflights13::flights flights <- flights[c(10, 16, 17)] var_interest <- c("distance", "hour") for (i in 1:length(

浏览 1提问于2021-02-17得票数 1

回答已采纳

1回答

data.table、dplyr等对象掩蔽

r、methods、data.table、dplyr

我应该使用dtplyr而不是data.table和dplyr吗？我是否应该害怕使用dplyr或data.table (独立的)，因为它们掩盖了许多来自“默认”包(如zoo、xts等)的函数？什么是好的练习？由于dplyr和data.table都在CRAN上--我想，作者进行了一些很好的实践，或者可能没有遵循的指导方针？我看到了许多关于对象掩蔽的问题，我想知道dplyr对象命名是否太麻烦了，还是说它是最好的选择？ > library(dplyr) -----------------------------------------------------------------------

浏览 0提问于2017-02-12得票数 0

3回答

使用dplyr对每个组应用函数并返回指定的数据

r、dplyr

我第一次使用group_map，并认为我做得对。这是我的密码： library(REAT) df <- data.frame(value = c(1,1,1, 1,0.5,0.1, 0,0,0,1), group = c(1,1,1, 2,2,2, 3,3,3,3)) haves <- df %>% group_by(group) %>% group_map(~gini(.x$value, coefnorm = TRUE)) 问题是，有一个列表，而不是一个数据框架。我要怎么做才能得到这个df wants <- data.frame(group

浏览 4提问于2020-10-05得票数 3

回答已采纳

1回答

不使用美元符号数据$列语法的dplyr组

r、dplyr、group-by、summarize、r-faq

我希望为每个组找到一个列的min和max值： mtcars %>% group_by(mtcars$cyl) %>% summarize( min_mpg = min(mtcars$mpg), max_mpg = max(mtcars$mpg) ) # # A tibble: 3 x 3 # `mtcars$cyl` min_mpg max_mpg # <dbl> <dbl> <dbl> # 1 4 10.4 33.9 # 2 6

浏览 6提问于2021-06-02得票数 2

回答已采纳

3回答

dplyr和非标准评估(NSE)

r、dplyr

我试图用dplyr编写一个以数据帧和列的名称进行汇总的函数，然后返回汇总的数据框架。我尝试了一堆来自lazyeval包的interp()排列，但是我花了太多的时间试图让它开始工作。因此，我在这里编写了一个函数的“静态”版本： summarize.df.static <- function(){ temp_df <- mtcars %>% group_by(cyl) %>% summarize(qsec = mean(qsec), mpg=mean(mpg)) return(temp_df) } new_df <

浏览 3提问于2015-01-14得票数 5

回答已采纳

4回答

将列名作为字符串传递给group_by和summarize

r、dplyr、summarize、rlang、quosure

随着dplyr从0.7版本开始，以下划线结尾的方法，比如summarize_，quosure，已经被弃用了，因为我们应该使用group_by_。请参阅：https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html 我正在尝试使用quo和!！来实现下面的示例。工作示例： df <- data.frame(x = c("a","a","a","b","b","b"), y=c(1,1,2,2,3,3), z

浏览 82提问于2017-10-25得票数 11

回答已采纳

1回答

与dplyr中的其他列相比，基于一个参考列的摘要

r、dplyr、reshape、summarize

我希望得到一个变量的和，这取决于其他变量的na或R中的non-na值。下面是一个工作示例代码： library(dplyr) df <- data.frame(A = c(1,2,3,NA,4), B = c(NA,2,3,NA,5), C = c(3,4,NA,NA,NA), REF = c(10,20,30,40,50)) df.na <- df %>% mutate_at(vars(-REF),is.na) sums <- matrix(0,2,3) row.

浏览 2提问于2022-01-26得票数 0

回答已采纳

1回答

在数据框中对相同名称下的特定观测值进行分组并添加其值

r、dataframe、conditional-statements、grouping

具有以下df。我需要转换第二个变量，其中所有名为(阿尔巴尼亚、安道尔拉和安哥拉)的观察值都归入观察名为GROUP的组中。(并在第三个变量中添加它们的相关值。我必须为不同的国家集团做同样的事情。 reporter partner value df> 1 Rep. of Korea World 162466097148 2 Rep. of Korea

浏览 0提问于2020-05-20得票数 0

2回答

dplyr按字符串总结

r、dplyr

我有一个具有数值和字符串值的dataframe，例如： mydf <- data.frame(id = c(1, 2, 1, 2, 3, 4), value = c(32, 12, 43, 6, 50, 20), text = c('A', 'B', 'A', 'B', 'C', 'D')) id变量的值总是对应于text变量，例如，id == 1总是text == 'A'。现在，我想用id (或者text，因为它

浏览 3提问于2016-11-16得票数 2

回答已采纳

1回答

查找按日期划分数据的R函数

我只有两天的时间，所以我希望我能提供足够的信息，我的问题。我有一个Excel表格的内皮细胞血管生成与技术重复在4个不同的日期。(但这些日期在不同的星期内都没有安排好) 我的数据看起来是这样的(当然，不仅仅是3月2日)：我想在这四个不同的日子平均数据，这样我就可以比较从第一天到第四天的"Nb节点“，从而最终得到一个包含组、被调查数据点和日期的抖动图。我是一名医学生，所以我还没有任何关于这类东西的知识，但我试着去学习。希望我提供了足够的信息！找到了解决办法： #Group by library(dplyr) DateGroup <- group_by(Exclude

浏览 6提问于2022-03-16得票数 0

回答已采纳

2回答

在函数中使用group_by时，如何保持相同的列名？

我有几个数据帧，我想要连接在一起。在这样做之前，我尝试创建一个函数，通过使用group和汇总第2列中的值来处理第1列中的重复项。问题是我想为第2列保留相同的名称，但我不知道如何做到这一点。例如： fruit_2015 <- data.frame(type = c("kiwi", "pineapple", "kiwi", "raspberry"), count_2015 = 1:4) library(dplyr) sum_duplicates <- function(df, x) { x <- enqu

浏览 5提问于2022-01-20得票数 2

回答已采纳

4回答

dplyr summarize:如何在输出表中包含所有表列

r、dplyr

我有以下数据集 # Dataset x<-tbl_df(data.frame(locus=c(1,2,2,3,4,4,5,5,5,6),v=c(1,1,2,1,1,2,1,2,3,1),rpkm=rnorm(10,10))) 如果我使用以下命令 # Subset x%>%group_by(locus)%>%summarize(max(rpkm)) 我获得了 locus max(rpkm) 1 9.316949 2 10.273270 3 9.879886 4 10.944641 5 10.837681 6 13.450680 虽

浏览 2提问于2015-07-08得票数 0

1回答

有了dplyr和my，我的代码就起作用了，但当我传递到purrr::map时，代码就不起作用了。

r、ggplot2、dplyr、purrr、quosure

我想要在向量中为每一列创建一个叫做日期的图。我的数据框架只包含这些列，我希望对其进行分组，计数出现的次数，然后绘制它。下面的代码可以工作，除了map，我想使用它来跨越以前未知数量的列。我认为我正确地使用了map，我以前在这方面取得过成功。我刚开始使用商，但考虑到我的函数调用有效，我不知道哪里出了问题。我看过其他几个似乎是这样设置的帖子。 df <- data.frame( date1 = c("2018-01-01","2018-01-01","2018-01-01","2018-01-02","2018-01

浏览 0提问于2018-11-06得票数 1

回答已采纳

1回答

将列内容设置为函数中的变量(R)

我试图在R中创建一个表，根据一个组(“处理”)计算汇总统计数据，作为一个更长的函数的一部分。在运行函数之前，我要输入dataframe名称(data)和列(y)，我需要对它们进行总结。 data = df y = df$columna x <- function(model) { summary <- data %>% group_by(Treatment) %>% summarize(Mean= mean(y), StdError = se(y), Mean_StdError = mean(y) + se(y), Max= max

浏览 1提问于2020-08-11得票数 0

回答已采纳

1回答

用户定义函数中的group_by错误

r、dataframe、user-defined-functions

df_devw %>% group_by(year, wage_tile) %>% summarize(mean_engi = mean(d_engi)) %>% pivot_wider(names_from = year, values_from = mean_engi)enter code here tbl <- function(x){ df_devw %>% group_by(year, wage_tile) %>% summarize(mean_value = mean(x)) %>%

浏览 1提问于2022-07-19得票数 0

1回答

在dplyr中使用group_by时，将缺失的字符串值处理为函数

r、group-by、dplyr

我希望创建一个可以接受多个字符串输入(本例中为2)的函数，并使用group_by返回结果，即使只输入一个字符串。我知道我可以创建if语句，以便在只将一个字符串传递给函数时绕过这种情况，但对于group_by来说，是否有更好的方法可以在不使用条件语言构建的情况下生成输出(也就是说，使用多个输入会变得更麻烦)。可复制示例 library(dplyr) # Create simple function car_fx <- function(df, grp1, grp2) { output <- df %>% group_by(.data[[grp1]], .dat

浏览 2提问于2020-05-13得票数 1

回答已采纳

2回答

dplyr _1 ()中不需要的摘要

r、dplyr

下面是dplyr中的一个汇总表的示例： library(dplyr) category <- c('A', 'A', 'A', 'B', 'B') col1 <- c(1, 1, 0, 0, 1) col2 <- c(1, 0, 1, 1, 1) tbl <- as_tibble(data.frame(category, col1, col2)) sum_tbl <- tbl %>% group_by(category) %>% summarize(a

浏览 12提问于2021-07-10得票数 0

回答已采纳

1回答

基于多重连接的中间突变体(/merge)

r、dataframe、dplyr

我有以下一些复杂的问题。考虑以下两个数据框架 df ID cat month_1 month_2 1 1 A 3 1 2 1 B 2 2 3 1 C 3 4 4 2 A 3 6 5 3 D 5 2 6 3 B 2 9 > df2 ID month_number 1 1 month_1 2 1 month_2 3 2 month_1 4 2 month_2

浏览 1提问于2019-09-26得票数 0

回答已采纳

2回答

确定哪些ID满足R中的所有条件

r、loops、if-statement

我认为这应该相对简单。我使用的是R的最新版本。在一个数据框中，我有一个ID编号为PairID的列和一个名为species with 15个不同物种的列。我想知道哪些PairID编号包含所有15个物种。数据框看起来像这样 head(analysis.df) species PairID DIKDIK 1 GAZELLE 2 GIRAFFE 1 ELAND 5 GIRAFFE 3 DIKDIK 2 我的想法是运行这个： for(i in 1:nrow(analysis.df)) { if (an

浏览 23提问于2019-03-14得票数 0

回答已采纳

2回答

用于总结()的dplyr管道多个数据集

r、dplyr

我正在用dplyr做桌子。我希望在多个数据集上执行相同的“汇总”命令。我知道在ggplot2中，您可以更改数据集并重新运行绘图，这是很酷的。以下是我想要避免的： table_1 <- group_by(df_1, boro) %>% summarize(n_units = n(), mean_rent = mean(rent_numeric, na.rm = TRUE), sd_rend = sd(rent_numeric,na.rm = TRUE), median_rent = median(rent

浏览 1提问于2014-12-19得票数 0

回答已采纳

3回答

为什么这种(分组) mutate_at语法可以工作，但summarise_at却失败了？

r、dplyr

示例数据： (tmp_df <- expand.grid(id = letters[1:3], y = 1:3)) # id y # 1 a 1 # 2 b 1 # 3 c 1 # 4 a 2 # 5 b 2 # 6 c 2 # 7 a 3 # 8 b 3 # 9 c 3 以下工作： tmp_df %>% group_by(id) %>% mutate_at(which(colnames(.) %in% c("y")), sum) # id y # <fct

浏览 0提问于2021-02-02得票数 0

回答已采纳

1回答

过滤时间序列中的所有列，使其仅保持顶部1/3

r、filter、time-series

我有一个时间序列，大约有100个日期，每个日期有50个实体(如此5,000行)和50列(都是不同的变量)。如何筛选数据帧中的每一列(每个唯一日期)，以保持每个日期上每列值的前1/3。然后得到该组在那个日期的平均回报。谢谢。我的数据组织如下，但每列中的数字都是随机的，就像"a“列中的数字一样(这是一个示例，实际数据有更多的列和更多的行)： Date Identity Return a b c d e f... ...z 2/1/19 X 5 75 43 6

浏览 0提问于2019-03-13得票数 1

回答已采纳

2回答

在R中计数多列和分组

r、dplyr

我最后一个问题的答案帮助我理解了dplyr n()。但我仍然无法解决我想要解决的问题。所以，我在这里张贴数据和实际问题。数据如下 finalCalledPartyNumber Call Day Call Date Block Answered Call Duration Opty ID Opty Created Date BC ID 19183598259 Monday 2016-12-05 12:26:46 Block 2(12:30 pm) 1 5 1234

浏览 3提问于2017-06-12得票数 2

回答已采纳

1回答

通过删除r中的NA来连接同名行

你好，我需要您的支持，以便将同名行连接在一起，并删除NA。如果列具有相同的名称，则使用下标创建新列，或将其与逗号合并。我有一个示例dataframe： name<-c("John","John","John","Luis","Luis") may<-c("a",NA,NA,"a",NA) june<-c(NA,"b",NA,NA,"a") july<-c("d",NA,"c",NA,NA) df

浏览 2提问于2022-07-28得票数 0

回答已采纳

3回答

按年在R中的数据中独立地订购列

数据： set.seed(0) Temp <- data.frame(year=rep(1:3,each=4),V1=floor(rnorm(12)*2),V2=floor(rnorm(12)*2)) year V1 V2 1 1 2 -3 2 1 -1 -1 3 1 2 -1 4 1 2 -1 5 2 0 0 6 2 -4 -2 7 2 -2 0 8 2 -1 -3 9 3 -1 -1 10 3 4 0 11 3 1 0 12 3 -2 1 我想在每年内独立地重新订购

浏览 3提问于2017-07-17得票数 0

回答已采纳

3回答

R:获取以范畴变量为条件的列的最小值

r、dplyr

我有一个数据集，如下所示： Attribute estimate Proximity 3.7 Proximity 1.54 Proximity 0.45 Waittime 0.7 Waittime 0.76 service 0.6 Knowledge 0.7 我想得到每个属性的最大值和最小值。我知道使用以下代码可以得到结果： min = fit.leb %>% #For each Class group_by(Attribute) %>

浏览 0提问于2016-02-14得票数 0

回答已采纳