如何使用Dplyr对R中的代码进行调试，以获得分组变量的标准差？

文章/答案/技术大牛

发布

1回答

、

使用"nycflights13“包，我回答了一个初学者的问题。我想得到运营商的到达延迟标准差(arr_delay)。我真的不知道为什么我的代码不能工作。它生成了包含两列的summarize表: sd_arr_delay和我的新变量sd_arr_delay，但是carrier的所有值都是NA。

浏览 11提问于2019-06-29得票数 0

1回答

SPSS用标准差填充临时变量

我正在学习SPSS，我有PL/SQL和T-SQL的背景大于平均值的1个标准差所有其他我想使用临时变量，但不知道如何找到现有变量的标准差，并将其填充到临时变量中，以用于我<e

浏览 18提问于2018-01-19得票数 2

回答已采纳

1回答

在dplyr中将分组数据pass传递给自己的函数

、、

我正试着从plyr转到dplyr。但是，我似乎仍然不知道如何在链式dplyr函数中调用自己的函数。data <- data %>% group_by(ID_variable) %>% f 有人能告诉我<

浏览 5提问于2015-01-28得票数 8

回答已采纳

1回答

R data.frame中的数据分组

、

什么是按相当于R的sql组，例如，我希望在data.frame上执行此操作按子集函数我知道sqldf，我不想把它用作什么用途

浏览 0提问于2015-09-27得票数 0

回答已采纳

1回答

R中一个完备数据群的方差

、、

假设我有一个包含10+1列和10行的数据，每个值都有相同的单位，除了一个列(“分组”列A)。我试图完成以下工作:给定基于最后一列的数据帧分组，如何将整个块的标准差计算为一个单一的整体变量。假设我进行分组(实际上，它是一个间隔的cut )：根据我收集到的这个站点的trhoughout，

浏览 0提问于2018-09-07得票数 0

回答已采纳

1回答

按R中的多列分组

、、、

我正在尝试创建一个包含多个变量的表我使用了dplyr包中的group_by，但它没有提供我想要的东西。 excel数据透视表中的例子给出了我想要的结果。 ? R不是像excel数据透视表那样对它们进行分组，而是按观察值返回。这是我用来从dplyr包中group_by然后总结的

浏览 13提问于2021-04-12得票数 0

1回答

我有多个netCDF4数据集，其中包含一整年的月度天气数据。在xarray中使用groupby方法提取月度数据后，我无法从分组结果中获得均值、标准差等统计信息。它在执行基本算术运算时会产生错误。我按以下方式对月度数据进行了分组： monthTime = ds.groupby('time.month') 在此之后，当我想要获取温度值时，它会显示一个错误： monthTime['temp'] Typ

浏览 16提问于2019-04-16得票数 0

1回答

如何实现以下cabbage_exp数据集的plyr包代码的dplyr。任何帮助都会成为学徒

、、

在这个数据集中，我想计算每个组中权重的比例(按日期分组)。在我的数据集中，有6个样本，每个样本都包含日期和权重。有3个日期d16、d20和d21，每个日期行都有一个权重值。因此，我的目标是按日期对数据进行分组，并计算相对比例权重。例如，组是(d16，d16)，(d20，d20)和(d21，d21)，每个组的相对重量比例应该加到100。下面的代码plyr包分裂在“日期”和计算权重的比例在每一组。它工作起来很有魅力，但

浏览 1提问于2017-08-29得票数 0

回答已采纳

2回答

具有多个变量名的字符串输入的dplyr::group_by_

、

我正在编写一个函数，要求用户在函数调用中定义一个或多个分组变量。然后使用dplyr对数据进行分组，如果只有一个分组变量，它就会按预期工作，但我还没有弄清楚如何使用多个分组变量。示例：y <- c("cyl", "gear") dots <- list(~cy

浏览 0提问于2014-12-29得票数 24

回答已采纳

2回答

在R中按组获取标准差

我想要得到R中每个组的标准差(在本例中是相同的属和种)。但是，我的一些组由n=1组成，因此我无法计算标准差。下面是一个随机数据集，它看起来与我的真实数据集相似 x = structure(list(V1 = structure(c(1L, 2L, 2L, 3L, 3L), .Label = c("Genus1factor"), V3 = c(6.32, 8.43, 8.31, 9.29, 8.96)), class

浏览 2提问于2020-03-11得票数 0

1回答

如何使用dplyr对这些变量进行分组以生成分组的摘要？

、、

这是我的dput： structure(list(Students = c(300L, 1600L, 100L, 90L, 2000L, 200L, -22L)) 我想总结一下有多少学生使用不同的中文书写，所以我试着使用下面的

浏览 14提问于2021-09-27得票数 0

回答已采纳

1回答

从按变量分组的数据中搜索和移除异常值

、、、、

)，这些值与按元素变量分组的中间值、值的标准差>2。从dataframe中移除异常值(或创建一个排除了异常值的新数据。我一直在使用dplyr包，并使用以下代码对"element“变量进行分组，并提供平均值： group_by(element) %>% summarise_

浏览 3提问于2015-02-24得票数 8

回答已采纳

1回答

在将` `dplyr::summarise()`与` `across()`函数一起使用时，我是否可以混合使用列表和公式语法

、

我想使用带有dplyr::across()函数的dplyr::summarise()来生成一个表，其中包含非缺失值的数量、一些变量的平均值和标准差。我可以使用purrr建模语法获得关于缺失值和平均值的信息，但是如果不使用多个汇总调用，然后使用bind_cols()，我不知道如何将摘要放到单个表中 iris %>% gr

浏览 15提问于2021-04-15得票数 4

回答已采纳

1回答

R dplyr* group_by -按变量内容*

、、

我使用dplyr group_by函数对我的数据帧进行分组，我需要做一些事情，比如data %>% group_by(c) 当我尝试这样做时，它弹出错误: error:未知变量to group b

浏览 1提问于2016-08-16得票数 2

2回答

使用dplyr向数据帧添加聚合列

、

我试图使用dplyr将聚合列添加到数据帧中。下面是我所想到的一个例子：age <- c(25, 30, 56)mydata<- data.frame(gender, age, weight) 我将数据框架mydata按性别分组，然后进行汇总计算，以

浏览 2提问于2016-07-26得票数 2

回答已采纳

2回答

R的group_by->filter->group_by->summarise等同于pandas中的快速原型？

、、

我必须转换一些代码从R到python。在R中，我们使用dplyr执行以下操作： df %>%summarise( a = sum(col_c == 'a'), b = sum创建函数是一个相当慢的过程，特别是当我们必须尝试创建多个新列进行实验时。我们可以做一些类似于我在熊猫中给出的例子，以类似的方式

浏览 13提问于2019-06-03得票数 0

1回答

创建一列，其值是基于r中的某些条件的另一列中的值的总和

id，TDD1列中的相应值应该是DO列中那些连续重复日期的值的总和。如果标志列的值是2或0，那么对应的TDD1值应该是该行的DO值。例如，请参见第2、7、11、15和20行(对于FLAG=2)和第12、13、14、18和23行(对于FLAG=0)。标志列具有连续重复的1，用于每个ID的连续重复日期，除非列CO具有值，并且在这种情况下，标志值变为2。例如，参见行9到11。在行6到8的情况下，日期连续重

浏览 1提问于2014-09-26得票数 1

2回答

你如何计算每种类型的平均评分？

、

我有一个30列的文件。这些内容包括userid、itemid、育婴名、评级、日期，以及其他用于对电影所属的类型进行分类的内容。类型类别是列名，列中有二进制值。如果电影属于某一类型，则在适当的列下有1，否则为0。我想计算每种类型的平均评分，并想知道是否有一个较短的过程可用？我目前已经尝试过滤数据，选择每种类型的值是'1‘，然后计算平均评级。但我几乎有24种类型，这样做是没有效率的，我认为。我尝试过的

浏览 3提问于2015-01-15得票数 0

回答已采纳

1回答

具有非标量特征向量的group_by

、、、

使用R 3.2.2和dplyr 0.7.2，我试图找出如何有效地使用作为字符向量的字段的group_by。选择很容易，我可以通过这样的字符串来选择一个字段 mpg %>% dplyr::select(field) 通过以下多个字符串来处理多个字段) 使

浏览 2提问于2017-07-26得票数 0

回答已采纳

1回答

dplyr排列不是按组排列

、

在这个超级简单的代码中，我希望dplyr首先按我的分组变量(blonde)排列，然后按年龄排列，但它似乎根本没有考虑到分组变量。我非常确定，这在过去对我来说是不同的。我希望(和期望)的是，它将首先按金发女郎排列(因为这是分组变量)，然后按年龄排列。我使用的是dplyr_0.5.0。当我在gro

浏览 5提问于2016-08-04得票数 3

点击加载更多