汇总数据时丢失R系数组织(dplyr)_R/dplyr:汇总数据，不分组_基数R而不是dplyr:分组并汇总数据？ - 腾讯云开发者社区

、、、

我尝试使用example执行以下操作，但我希望自动生成带有lm()的汇总表的选项卡。我首先创建了包含所有汇总表的列表：list_lm --- title: author: date: output: html_document --- # {.tabset} ```{r} list_lm=list() 对于(1:10中的i){ list_lm[i]= lm(距离~速度，data=cars) } ```{r,results='asis', echo=FALSE} 对于(1:10中的i){ cat('##'，i，‘\n') 打印(list_

浏览 22提问于2020-07-21得票数 2

回答已采纳

2回答

在区域级别使用doBy包汇总数据

我有一个如下的数据集数据， Region Country Market Price EUROPE France France 30.4502 EUROPE Israel Israel 5.14110965 EUROPE France France 8.99665 APAC CHINA CHINA 2.6877232 APAC INDIA INDIA 60.9004 AFME SL SL 54.1729685 LA BRAZIL BRAZIL 56.

浏览 1提问于2015-02-24得票数 1

1回答

平均R个对象

、、

假设我有几个R对象，例如lm输出： m1 <- lm(x ~ y, data = data, subset = sample==1) m2 <- lm(x ~ y, data = data, subset = sample==2) m3 <- lm(x ~ y, data = data, subset = sample==3) m4 <- lm(x ~ y, data = data, subset = sample==4) 现在我想对这些对象求平均，即我想对lm产生的所有估计值求平均。如果我能得到对象中所有参数的汇总统计信息，即平均截距等，我将非常高兴。简化问题的是，所

浏览 4提问于2014-12-02得票数 0

3回答

系数的不同NA作用及R中线性模型的总结

、、、

在R中，当使用lm()时，如果我在对lm()的调用中设置了na.action = na.pass，那么在汇总表中，对于任何无法估计的系数(因为本例中缺少单元格)，都会有安娜。但是，如果我使用summary(myModel)$coefficients或coef(summary(myModel))从摘要对象中仅提取系数，则NA将被省略。我希望在提取系数时包含NA，就像打印汇总时包含NA一样。有没有办法做到这一点？设置options(na.action = na.pass)似乎没有帮助。下面是一个示例： > set.seed(534) > myGroup1 <- facto

浏览 0提问于2012-06-07得票数 10

1回答

使用r计数data.frame多列中出现的字符

、、

我是R的新手，有一个有100列的data.frame。每一列都是字符数据，我试图对每个列显示字符的次数做一个总结。我希望能够一次对所有列进行汇总，而不必为每一列键入代码。我试过了 occurrences <- table(unlist(my_df)) 但是这个表给出了所有列的汇总(不是每个列的摘要)。当我为一列做摘要时，我的输出看上去很像我想要的，但只对这一列： BG_occurrences <- table(unlist(my_df$G)) 1 na SOME 17 20 1 是否有一种方法可以同时对每列中的所有数据进行编码和汇总？我希望输出如下所示

浏览 1提问于2021-01-28得票数 1

回答已采纳

2回答

动态变量R中的dplyr摘要

、

我试图在R中使用汇总和分组，但是，当我使用一个变量代替显式调用汇总列时，它对每一行的整个数据集使用dist之和，而不是正确地分组。这可以很容易地从下面的TestBad和TestGood之间看出。我只想能够使用GraphVar变量复制TestGood的结果，就像在TestBad中一样。 require("dplyr") GraphVar <- "dist" TestBad <- summarise(group_by_(cars,"speed"),Sum=sum(cars[[GraphVar]],na.rm=TR

浏览 2提问于2016-08-31得票数 6

回答已采纳

1回答

如何使用group_by获取每个组的平均值

、

使用mpg数据集，我想按位移量分组(2.0和3.1)。下一次将2.0组的所有cty加起来。最后，在最后一列中，将上面的和除以2.0和3.1的所有cty之和。到目前为止，我只能在没有错误的情况下进行分组： data(mpg) mpg2 <- filter(mpg, manufacturer == "audi" & year == 2008 & cyl < 8) x <- group_by(mpg2, displ) # %>% mutate(total_cty = {sum(.$cty)}) #new column gett

浏览 3提问于2020-02-28得票数 0

1回答

RMarkdown:将摘要输出统计信息嵌入到散文中

、

你好，我正在尝试将摘要输出中的特定数字(例如系数、t值和p值)嵌入到我的R Markdown文件的prose部分。例如，我在下面创建了一个数据框架，我想将摘要输出中的统计数据直接拉到我的散文中。 ```{r regression} startsal =c(5，7，7，5，6，7，5，6，7，5，6，5，5，5，6，6，6，8)#学生停学时的起薪 yrsed = c(16,19,20,16,13,20,16,18,20,16,14,20,16,18,21,16,18,20) #年学科教育年限父母收入=c(5，6，8，5，6，7，5，6，8，5，5，4，8，5，6，3，6，9)#受试者父母的收

浏览 1提问于2014-01-19得票数 1

1回答

根据标准总结两行之间的值

、、、、

我有这个数据在“年龄”列中的值需要根据整个大小范围进行汇总，即现在的数据框架如下所示： Size Age 1 Age 2 Age 3 [1] 8 2 8 5 [2] 8.5 4 7 9 [3] 9 1 11 45 [4] 9.5 3 2 0 但我想要这个 Size Age 1 Age 2 Age 3 [1+2] 8 6 15 16 [3+4] 9 4

浏览 2提问于2022-11-18得票数 1

1回答

在R个汇总数据帧中添加关于一个因子的比例

、

我已经使用R的“汇总”功能创建了一个汇总数据框架，包括两个因素-“公司大小”和“案例状态”-以及“公司大小”和“案例状态”的每个组合的记录数(n)。公司的大小有三个级别，案例状态有四个级别，所以我在这个汇总的数据框中总共有12行。下面是汇总数据框的脚本(包括前面的'group by‘函数)： df <- group_by(df, df$Firm.Size, df$`Case Status`) summ_firm <- summarize(df, num_records = n()) 我想在汇总数据框架中创建一个新列，该列提供单个行的记录数(即给定的“公司大小”和“案例状态”

浏览 0提问于2018-02-28得票数 0

1回答

R中对象的S3汇总方法

我是R的新手，我有一个问题，我一直在努力解码我需要做的事情。“为WeatherData类的对象编写一个S3汇总方法，该方法生成按季节划分的rain，maxtp，mintp，maxgt变量的统计汇总:平均值，标准差，最小值，最大值。忽略计算中缺少的值”。我处理的对象包含从1941年11月到2019年5月在都柏林机场́大都会气象站记录的历史月度数据。(来源：)。我该如何继续呢？

浏览 11提问于2019-11-06得票数 0

1回答

将by()的回归输出组合到单个表中

、、、、

我对R、编码和堆栈溢出非常陌生:如果这是一个基本问题，请提前道歉。我试图将变量“性别”的三个层次的回归输出合并成一个单一的汇总表，该表保留列中的所有信息以及每个输出底部列出的值(残差、r2、调整后的r2、F-统计量、p值)。有人知道一种可行的方法吗？下面是我的输出当前的样子： library(tidyverse) Final_Frame.df <- read_csv("indirect.csv") my.fun <- function(Final_Frame2.df){summary(lm(Product_Use~Mean_social_combined +

浏览 1提问于2021-03-14得票数 0

回答已采纳

1回答

在线性回归中，标度给了我更坏的结果(较低的R平方)。

、、

(我将数据集保留在底线上)。我试图在数据集上使用线性回归，其中预测器是产品ID、权重、类型、Outlet_Establishment_Year等，目标变量是Item_Outlet_Sales。我用R-平方作为度量。我认为预测器有不同的单位，所以我需要对它们进行缩放。如果我这样做： X = cleaned_data.iloc[:, :-1] # predictors X = pd.get_dummies(data = X, drop_first = True) # convert categorical variables to numerical variables Y = cleaned_d

浏览 12提问于2022-10-29得票数 0

2回答

汇总可变数量的列

、

我有一个spark数据框架(在R和sparklyr的上下文中)，它有三列: id、x和y。 df <- df %>% group_by(id) %>% summarize(x=sum(x),y=sum(y)) 现在假设我现在接收到一个列数可变的数据帧。除了id之外，所有其他列都是双精度的，我需要像以前一样对它们进行总结。当然，我可以得到列名，迭代汇总每个列名并连接结果，但它看起来很难看。有没有一种简单的方法呢？

浏览 3提问于2018-05-17得票数 0

3回答

我能用R中的"summarise_all“函数计算所有列的标准误差吗？

、

我正在为R中的dplyr准备课程材料。假设我们的数据集是"iris“，有人可以使用汇总所有函数来计算所有列的平均值和sd。 iris %>% group_by(Species) %>% summarise_all(funs(mean, sd), na.rm=TRUE) 然而，当我试图计算标准误差时，我得到了一个错误消息。 iris %>% group_by(Species) %>% summarise_all(funs(mean, sd, se = sd/sqrt(n)), na.rm=TRUE) 任何帮助都是非常感谢的

浏览 17提问于2020-04-30得票数 1

回答已采纳

1回答

范畴变量的聚合

我希望聚合我的数据库，包括分类变量，以便每行表示来自原始数据的多个行(例如，基于学生ID)。每个列都需要保存原始数据中最常见的值(每个聚合ID)。示例:我希望按学生汇总数据，并查看最常见的分类变量级别--例如： student class a h (being h the dominant level for the variable "class" 我在R工作室工作

浏览 0提问于2019-01-02得票数 0

回答已采纳

2回答

如何打印要素级汇总统计数据的最小和最大值(取最小和最大中间值/比例)？

、、

我有如下数据，包括10种产品(a，b，c，.)，以及它们的描述(其他变量)。我需要报告其他变量的汇总统计量(中位数/比例)在产品之间的范围(应该作为每个汇总统计值的最小值和最大值来打印)。例如，：哪种产品的价格最低，哪种产品的中位数最高(只需要报告两个值，产品名称就不重要了)。哪种产品具有最低和最高的比例的“坏”评级(只需要报告两个值，产品名称不重要)。有一个简单的方法来编码它吗？我的实际数据有10,000个产品和150个其他变量，目瞪口呆的汇总表会让我丧命。数据 ```{r} data.frame( 产品=rep(字母1:10，每个字母= 2，次数= 500)，价格= rnor

浏览 5提问于2020-09-12得票数 0

2回答

在R线性模型中，只求出相互作用系数的p-值。

、

如果我在R中有一个线性模型的汇总表，我如何才能得到与交互估计相关的p-值，或者仅仅是组截取，等等，而不必计算行号呢？例如，使用lm(y ~ x + group)这样的模型( x为连续模型，group为范畴)，lm对象的汇总表有对以下方面的估计：截取 x，所有组的斜率 5组内的差异与总体拦截 5组内与整体坡度的差异。我想找出一种方法，得到每一个作为一组p-值，即使组数或模型公式改变。也许汇总表中有一些信息可以用来对行进行分组？下面是两个不同模型的示例数据集。第一个模型有四组不同的p值，而第二个模型只有两组p值。 x <- 1:100 groupA <-

浏览 4提问于2012-06-27得票数 10

回答已采纳

1回答

来自变量的r组数据帧

、、

我希望设置将数据帧分组为变量的列，然后根据该列对数据框架进行分组和汇总，即 require(dplyr) var <- colnames(mtcars)[10] summaries <- mtcars %>% dplyr::group_by(var) %>% dplyr::summarise_each(funs(mean)) 这样，我就可以简单地更改var并使用第二行而无需更改任何内容。不幸的是，当group_by询问列名而不是变量时，我的解决方案不起作用。

浏览 6提问于2016-09-09得票数 0

回答已采纳

1回答

dplyr管道:总结复杂的函数

、、

我使用以下代码从我的原始数据‘data.frame’生成伪'df‘。 > df<-pseudo %>% group_by(Drug, CLSI_interpretation) %>% summarise(n = n()) %>% filter(Drug %in% c('Cefepime', 'Ceftazidime', 'Piperacillin','Piperacillin/tazobactam','Imipenem','Meropenem

浏览 0提问于2015-04-21得票数 1

1回答

以不同的时间间隔剪切时间/日期数据

、

我正在使用R分析从40,000多个事件中收集的365天的数据。这些事件发生在一天中的不同时间。我希望以不同的时间间隔汇总事件并计算平均值，例如2小时、8小时、12小时或每天。我见过使用CUT和AGGREGATE，但它似乎没有提供所需的间隔。任何建议都将不胜感激。

浏览 13提问于2016-08-03得票数 0

回答已采纳

2回答

生成R中的条件摘要统计量？

、

我对这个相当简单的问题表示歉意，因为尽管我在计量经济学/回归分析方面有一些R方面的经验，但我还是设法跳过学习如何在R中创建基本的汇总统计数据，如何生成一个输出来计算该特定数据的观察数。对于此数据，如何计算特定列的每种类型的不同数目(即：“侧”列中有多少个L和Rs )？如果“侧”列等于“L”(例如，当'Side‘等于'L’时，绿色、红色或蓝色的百分比是多少？ Side State Color Type L O Green B R C Red Q R O

浏览 3提问于2020-10-03得票数 0

回答已采纳

1回答

将列内容设置为函数中的变量(R)

我试图在R中创建一个表，根据一个组(“处理”)计算汇总统计数据，作为一个更长的函数的一部分。在运行函数之前，我要输入dataframe名称(data)和列(y)，我需要对它们进行总结。 data = df y = df$columna x <- function(model) { summary <- data %>% group_by(Treatment) %>% summarize(Mean= mean(y), StdError = se(y), Mean_StdError = mean(y) + se(y), Max= max

浏览 1提问于2020-08-11得票数 0

回答已采纳

1回答

将参数传递给dplyr汇总函数

、、

我试图使用dplyr中的汇总函数来计算摘要统计数据，使用两个参数函数从连接的数据库传递表和字段名。不幸的是，当我用另一个函数包装汇总函数时，结果是不正确的。end表是一个不遍历每一行的dataframe。我将在下面显示输入/输出：摘要统计函数库(Dplyr) data<-iris data<- group_by(.data = data,Species) SummaryStatistics <- function(table, field){ table %>% summarise(count = n(), min = min(table[[fi

浏览 1提问于2017-01-21得票数 3

回答已采纳

1回答

摘要不再分组

、

我觉得dplyr很棒。不过，我最近更新了包，似乎不再按组汇总。类似于升级前按组汇总的以下代码： iris_tdt <- tbl_dt(iris) iris_tdt %.% group_by(Species) %.% summarise(avg_petal_width = mean(Petal.Width)) avg_petal_width 1 1.199333 这用于输出一个包含物种和avg_petal_width的表。现在，似乎删除了物种列，并将avg_petal_width聚合为单个值。group_by似乎在工作，所以我猜这是总结的一个问题。 grp <-

浏览 0提问于2014-03-11得票数 2

回答已采纳

2回答

当我使用管道时，如何使平均函数工作？

、

这可能是一个简单的问题，但我在使用dplyr获取平均值函数时遇到了困难。使用mtcar数据集作为示例，如果我键入： data(mtcars) mtcars %>% select (mpg) %>% mean() 我得到“警告消息:在mean.default(.)：参数不是数字或逻辑:返回NA”错误消息。但出于某种原因，如果我重复相同的代码，但只要求提供“汇总”或“范围”或其他几个统计计算，它们可以正常工作： data(mtcars) mtcars %>% select (mpg) %>% summary() 类似地，如果我在基R符号中运行均值函数，这也很好： m

浏览 1提问于2018-10-09得票数 4

回答已采纳

3回答

Microsoft.Crm.CrmException:升级时不支持6.0.0.809版本的数据库

在从CRM 2011汇总更新14迁移到CRM 2013 sp1时出现以下错误。“Microsoft.Crm.CrmException:升级时不支持6.0.0.809版本的数据库。” 在CRM 2013上安装SP1之前，数据库CRM导入时没有任何issue.The，只有更改是SP1安装，而我要导入的数据库实际上是同一个CRM2011组织的另一个副本。有人知道是什么导致了这个问题吗？

浏览 7提问于2014-06-07得票数 1

回答已采纳

1回答

根据特定条件提取以下一行数据

有一个非常大的数据~1GB，并希望提取具有以下条件的汇总数据： for loop: if(a[i] == 999) then extract b[i+1] else next 这样我就可以table(b)找到它的分布/组合，假设列b是类字符，列a是类整数。我的R代码： summary123 <- data.frame() j = 1 k = 1 for(i in 1:nrow(df1)){ if(df1$a[i] == 999 & i != nrow(df1)){ j = i + 1 summary123[k,1] <- df1$b[j]

浏览 0提问于2018-05-11得票数 1

回答已采纳

2回答

如何在R中创建多个循环？

、

我正在使用一个国家的每日死亡人数数据库，因此我需要创建一个数据库，其中包含按日、月和州划分的每日死亡人数的汇总数据。我的数据库(def_2020)是这样的： |--------------|------------|-------| | State | Month | Day | |--------------|------------|-------| | state1 | jan | 1 | |--------------|------------|-------| | state1 | jan |

浏览 20提问于2020-11-17得票数 0

回答已采纳

1回答

如何在R中合并和聚合两个具有行和列变量的表？

我正在学习用我的课堂数据来使用R。我把当地学校网站上的数据刮到excel上，然后把它读到R中。每次测验之后，我想把数据汇总到一个表格中。例如，我有两张桌子 Subject Correct Incorrect 1 Math 9 1 2 Chemistry 7 6 Subject Correct Incorrect 1 Math 4 3 2 Biology 3 6 我想以 Subject Correct Incorrect 1 Mat

浏览 6提问于2022-07-14得票数 1

回答已采纳

2回答

R中值的计数数

、、

我有以下数据集： ClaimType ClaimDay ClaimCost dates month day 1 1 1 10811 1970-01-01 1 1970-01-01 2 1 1 18078 1970-01-01 1 1970-01-01 3 1 2 44579 1970-01-01 1 1970-01-02 4 1 3 23710 1970-01-01 1 1970-01

浏览 0提问于2017-01-25得票数 5

回答已采纳

1回答

如何使用dplyr::summarise_at()将列名传递给R中的模型公式

、

我试图从R中的一系列模型中得到一些汇总数据。例如，我可以将变量传递给公式的LHS： library(tidyverse) mtcars %>% summarise_at(vars(cyl:hp), list( r = ~summary(lm(formula = . ~ mpg))$r.squared )) cyl_r disp_r hp_r 1 0.72618 0.7183433 0.6024373 但我似乎不能把变量传递给RHS： mtcars %>% summarise_at(vars(cyl:hp), list( r =

浏览 3提问于2020-01-12得票数 1

回答已采纳

2回答

使用R中的条件替换列中的值

、、

我有一个非常基本的R问题，但我很难得到正确的答案。我有一个数据框，看起来像这样： ind<-rep(1:4,each=24) hour<-rep(seq(0,23,by=1),4) depth<-runif(length(ind),1,50) df<-data.frame(cbind(species,ind,hour,depth)) df$depth<-as.numeric(df$depth) 我希望它选择并替换所有行中的depth < 10 (例如)为零，但我希望保留所有与这些行相关的信息和数据框的原始尺寸。我已经尝试了以下方法，但这不起作用

浏览 3提问于2012-12-14得票数 57

回答已采纳

1回答

如何了解Weka中系数和模型的意义？

、、、

我一直在用R来建立线性回归模型。并使用“汇总(模型)”命令，提供系数显着性和模型显着性(F-统计量)的详细信息。Weka能提供这种措施吗？

浏览 2提问于2014-07-02得票数 1

回答已采纳

1回答

R:从固定周期估计的方程中滑动一步预测。

、、、、

下面的玩具模型代表了一个更多的变量，转换，滞后等等，假设我做对了。我的数据是按时间排序的，但现在被格式化为R时间序列，因为我需要排除某些时间段，等等。为此，我不想把它变成时间序列，因为我认为这很容易混淆，但是如果需要，或者它大大简化了估计过程，我想只使用一个整数序列，比如索引。下面，表示时间，如果允许的话。我的问题很简单(希望如此)。我想用我的数据的第一部分来估计模型的系数。然后，我想用这些估计数，而不是滑动窗口的估计值，对这些数据的每一个剩余值进行一次预测。其思想是，这个公式是适用于滑动窗口，尽管它不是用一个估计。显然，我可以重新键入包含系数的模型，然后以多种方式得到我想要的，使用基R

浏览 1提问于2020-02-06得票数 0

回答已采纳

2回答

R-获取包含数据帧的指定百分位数级别的汇总表

、、、

我希望获得一个汇总表，它显示的不是R中summary(x)函数生成的典型描述性统计数据。例如，10%百分位数、90%百分位数。我在网上找到的其他答案推荐了给出答案的方法，但不是以表格的形式。我一直在寻找一种方法，只需在summary(x)函数生成的汇总表中添加指定的百分位数级别。以下是示例数据： df = data.frame("a"=seq(1,10), "b"=seq(10,100,10), "c"=letters[seq(1,10)], "d"=seq(5,95,10)) ?

浏览 19提问于2020-08-30得票数 0

回答已采纳

1回答

在r中分组和计数的麻烦

我有一个叫data.frame的世界。这个数据框架列出了列名称中的国家。y，我有一个语言列，名为languages。我需要列出使用4种以上语言的国家的名称。我对此的第一个看法是汇总国家和语言。 language <- data.frame(table(Worldname.y,World#qcStackCode#language)) 当我跑到头(语言)时，它不起作用了。

浏览 0提问于2018-12-06得票数 0

1回答

Group_by (dplyr)，其中一个因子作为列

、、、

在下面的虚拟数据集中，我想创建一个按三个变量分组的汇总表。到目前为止，我使用的是dplyr。但是，我希望将r的值作为列名，将x1和x2值作为行名，并使用来自m的值填充相应的单元格。 r <- rep(seq(1,10,1),10) x1 <- rbinom(100, 1, 0.5) x2 <- rbinom(100, 2, 0.5) y <- rnorm(100, 10, 5) df <- data.frame(r,x1,x2,y) library(dplyr) View(df %>% group_by(x1,x2,r) %>% s

浏览 11提问于2019-01-25得票数 0

回答已采纳

2回答

45度线的最佳拟合

、

(我知道这一定非常容易，但我在R:) 我在X和Y向量中保存了x和y值的数据集。我知道数据的图应该是精确的-45度线(见下图)。如何找到最适合数据的-45度线(+从汇总(lm(.))中获得的所有这些统计数据？我试过了，但我不能强迫它放弃拟合坡度参数谢谢在尝试：lm(y~1,offset=-x)和应用abline(coefficient, -1)之后，我获得了下面的图(参见下面) 黑线是fit的情节，黄色的是我的猜测适合-- lm有什么问题，还是我完全错过了什么？

浏览 0提问于2015-11-24得票数 2

回答已采纳

1回答

没有显示汇总表中的因子级别

、

我有如下所示的数据集 > head(n2) # A tibble: 6 x 4 Pain Redness Swelling Tiredness <fct> <chr> <chr> <chr> 1 Yes No No Yes 2 No No No No 3 Yes No No Yes 4 Yes No Yes Yes 5 No No No

浏览 3提问于2021-12-26得票数 2

回答已采纳

1回答

使用For循环进行数据聚合

、、

我有一个数据集，其中包含每支球队17年来每个篮球运动员的统计数据。在R中，我试图通过使用for循环将这些球员级别的观察转换为团队级别的观察(每年)，该循环遍历年份和球队，然后汇总前三名得分手的个人统计数据(得分、助攻、篮板等)。你建议我如何继续？(在下面你会发现我目前的尝试，它只从数据集的最后一支球队和年份中提取观察数据，而不能从前三名中提取其他统计数据，如助攻和篮板数)。 for (year in 2000:2017) { for (team in teams) { ts3_points =top_n(select(filter(bball, Tm == team & Yea

浏览 0提问于2019-10-25得票数 0

1回答

使用列表对象的for循环定义多个数据流

、

非常绿色的R用户在这里。对不起，如果有人问这个问题，并在别的地方回答，我自己也找不到任何东西。我不明白为什么我不能让一个for循环工作，定义多个新的数据文件，但是循环遍历一个预定义的列表。 “我的列表”是从现有的dataframe的变量名称的子集定义的： varnames <- colnames(dplyr::select(df_response, -1:-4)) 然后，我想循环遍历列表，为包含汇总函数结果的列表中的每个变量名称创建一个新的数据格式： for (i in varnames){ paste0("df_",i) <- summary(past

浏览 4提问于2022-11-14得票数 1

回答已采纳

1回答

在r中使用prcomp for PCA时显示对应PC的名称

、、

我使用prcomp在r中运行PCA。当我输出汇总时，即标准差、方差比例、累积比例，结果总是排序的，实际的列名被PC1，PC2替换。因此，我不能说出每一列的确切方差比例。有没有人可以向我展示或者给我一些提示，告诉我在输出汇总结果时如何显示列。这里附了两张结果图： ? ?

浏览 36提问于2019-10-15得票数 0

1回答

对分组后出现的事件进行计数，返回一个序列，但不在R中进行汇总

、、、

我有一个数据帧，看起来像这样： ID Date result 1 1/1/2010 100 1 1/1/2010 200 2 1/1/2011 300 3 1/1/2011 400 3 1/1/2011 500 3 1/1/2011 600 我想在此数据框架中包含另一列： ID Date result Date_num 1 1/1/2010 100 1/1/2010 (1) 1 1/1/2010 200 1

浏览 2提问于2015-07-15得票数 0

1回答

通过在R中创建一个用户定义的函数来准备数据

、

我希望使用R和package dplyr来准备或总结一列值，使用带有用户定义函数的汇总(在dplyr中)，或者手工定义它。但是，数据没有在指定的组上聚合。有关详情，请参阅以下短文。提供了所需的结果。 library(dplyr) ver="dplyr version 1.0.5" #create user defined function intended for summarise() myfun=function(values){ values^2} 进口数据 df=data.table( grp=c("x","x","y&

浏览 2提问于2021-07-11得票数 0

回答已采纳

3回答

错误：`n()`只能在dplyr谓词中使用

、

运行R 4.0.2和dplyr 1.0.2 我正在尝试在srvyr对象上的汇总调用中使用n = n()： relduration_by_age_grp <- l %>% filter(ongoing == 0 & ptype == i) %>% select(ego.id, ptype, age.grp, ego.age.grp, duration, ego.wawt) %>% mutate(min.age.grp = ifelse(age.grp < ego.age.grp,

浏览 3提问于2020-08-27得票数 6

回答已采纳

3回答

按函数内的变量进行分组和汇总

、

如何使用ddply对变量进行分组并进行汇总？例如： library(plyr) sample <- function(x, g){ print(g) print(x[[g]]) res = ddply(x, ~x[[g]], summarise, value = mean(value)) return(res) } x = data.frame(type = c('a', 'a', 'a', 'b'), age = c(20, 21, 21, 10),

浏览 2提问于2017-08-02得票数 1

回答已采纳

2回答

如何使用ifelse()命令在R中创建虚拟变量

、

我正在尝试为R创建一个虚拟变量，问题是在我的餐馆'type‘数据集下有许多分类变量。其中，我希望素食餐厅的值为1，其余的为0。因此，当我运行回归汇总时，我得到了截取结果，b1表示reviews_number，b2表示纯素食餐厅。例如，非素食餐厅将是y=b0+b1(reviews_number)，而素食餐厅将是y=b0+b1(Reviews_number)+b2(素食)。提示是使用ifelse()命令，但我似乎不能将系数简化为3。否则，我需要为每种类型的餐厅分别创建一个值……

浏览 2提问于2018-09-23得票数 3

回答已采纳

1回答

如何从dataframe中选择多个变量并将其存储在新的dataframe中

我搜索并找到了这个解决方案，这是我想要的，但它并不像它应该的那样工作。我有81个变量和114,000个观察值。我只想从这个数据帧(loanData)中选择25个变量。通过使用 LoanVars <- select.list(names(loanData),multiple=TRUE, title='select your variable names', graphics=TRUE) 我能够选择我想要保留的所有变量，并将其存储在LoanVars中。我以为这是我要使用的新数据帧。但事实并非如此。当我尝试汇总(L

浏览 0提问于2018-03-22得票数 0

3回答

如何统计R中df中满足一定条件的值的个数

假设我有如下数据 date value location 1/1 10 A 1/2 15 A 1/3 20 A 2/1 15 A 2/2 10 A 2/3 5 A 2/4 12 B 2/5 15 B 2/6 5 B 2/7 20 A 我想按位置汇总1/31之后所有超过10的值的计数。因此，我的输出将为位置A提供3，为位置B提供2。您知道如何在R中实现这一点吗？

浏览 48提问于2018-06-06得票数 0