使用dplyr根据低于特定值的观察值数量删除组

文章/答案/技术大牛

发布

1回答

、

"Year"=c(1,2,3,1,2,3,4,5,1,2,3), "Count"=c(5,0,0,10,15,8,0,6,0,0,10)) 我正在尝试弄清楚如何根据非零计数的数量删除整个组具体地说，我希望删除只有一个非零计数的组，并保留所有其他具有多个非零计数的组。在此特定示例中，最终结果将如下所示： df <- tibble(

浏览 4提问于2021-01-22得票数 0

回答已采纳

1回答

如何在R中使用filter和str_detect筛选部分匹配对的数据？

、、、

我正在尝试筛选具有匹配组的数据，如果它们没有匹配组，我希望删除这些观察值。#9 pear_1 A small#11 pear_3 A small 在这里，我决定每个苹果观察值必须通过它们的编号与每个观察值配对因此，我们可以看到，由于只有一个pear_2观察值

浏览 25提问于2021-06-03得票数 0

回答已采纳

1回答

每组保持随机行，但每组保持不同的行数。

、、、

来自package dplyr的函数()允许随机保留特定的行数。例如，结合group_by()，您可以保留每个组的2个观察结果： select(vs, drat) %>% sample_n(22] <dbl> <dbl>2 0 3.9 4 1 3

浏览 3提问于2020-01-13得票数 1

回答已采纳

1回答

在R中使用dplyr进行过滤时返回整组

、

如果一个小组的观察至少有一个符合过滤标准，我想返回该小组内的所有观察结果。 test <- data.frame('prod_i

浏览 0提问于2019-01-22得票数 0

回答已采纳

1回答

我想根据匹配的时间戳将一个数据帧中的某些行替换为另一个数据帧中的行(两个数据帧在同一个tz中都有时间戳)

、、

我希望能够从一个dataframe中获取一些值，并将这些值插入到另一个dataframe中(两者具有相同数量的具有相同标题的列)。我希望dataframe 1中每一行中的值根据匹配的时间戳替换dataframe 2中的值。对于大多数行/时间戳，我希望原始数据保留在dataframe 1中，因此这只针对一组特定的时间戳(在datafram

浏览 14提问于2021-08-13得票数 0

1回答

n=n( )在R中是什么意思？

、、

library(dplyr) net.multiplicity <- group_by(net, nodeid, epoch) %>% summarise(n=n()) %>%

浏览 3提问于2014-09-16得票数 9

1回答

在R中定义函数时，如何统计一列中的观察值数量？

、、、、

我正在尝试定义一个函数，它将接受两个参数，并且将根据另一列(The_words)计算给定数据帧的列(Morph_column)中的括号数量。之后，我需要计算长度列中的观察值的数量，例如，如果"the_words“返回的括号数量为1，我需要知道数据帧中有多少项具有相同的长度(1)。2，3，4，5的观测值也是如此。当我尝试在dply

浏览 81提问于2021-06-17得票数 1

回答已采纳

1回答

如何生成组之间成对共享的矩阵并将其可视化

、、、、

组内没有重复的观测值，但在整个数据集中组之间有许多重复的观测值。我想要两组之间有多少重复观察的成对矩阵。Bat 3 Night Bat 3 Night Deer 2 Night (在A组和B组) 我最接近的是这段代码，它没有创建成对矩阵，而是列出了共享的观察值如果有人能给我如何在<

浏览 11提问于2020-04-29得票数 1

回答已采纳

2回答

根据观察值的数量删除变量

我有一个包含大约1000个变量的SPSS文件，我必须删除有效值为0的变量。我可以想到一个带有if语句的循环，但我找不到如何编写它。

浏览 2提问于2016-02-12得票数 2

1回答

按R组统计符合特定标准的观测值

、、

我需要一些帮助，按组计算符合特定标准的观察值。首先，我希望将按位置划分的雇员数量作为一列。然后，我想检索工作超过40小时(按位置)的员工数量，并将其汇总到一个列中。我假设有一个简单的方法可以用dplyr或base R来完成，但是我被难住了。我的数据如下。WIBrad 60 OH Sam

浏览 12提问于2021-09-15得票数 1

回答已采纳

3回答

如何使用dplyr过滤出具有满足特定属性的列的整个组？

、、

以mtcar为例:假设我想删除基于"carb“列的组，如果组中的任何观察值的"disp”小于100。我知道如何使用base R执行此操作： data(mtcars)xx <- xx[sapply (xx, function(x) min(x$disp) > 100)] xx <- do.call

浏览 11提问于2020-03-24得票数 0

回答已采纳

2回答

对附近观测值的求和

、、

我有一个很大的data.frame，其中包括商品的价格和每个价格售出的数量。我喜欢找到与每行价格相似(在一个范围内)的销售商品的总数量。例如，对于第j个观察(行)，我喜欢找出价格低于Price_j+50且高于Price_j-50的商品数量之和，对于其他观察结果也是如此。我可以在观察值上运行for循环，并根据每个观察</e

浏览 0提问于2019-07-25得票数 1

2回答

基于组的新列的变异

、、

是否有一种方法可以根据公共列值(id)将行分组，然后根据每个组中值是否在1000以上和/或低于1000的情况，用新id (new.id)对新列进行变异？例如： < 1000 = "low/low" (其中该组中的所有值都低于1000)< 1000 and > 1000 = "low/high" (其中一些值<e

浏览 1提问于2020-11-10得票数 1

1回答

在dplyr中仅按一个变量分组后取消分组

、

我有很多重复测量的单位。dplyr来删除观察值数量较少的值。在这个玩具数据上，假设我想删除计数少于2的数据 group_by(Item) %>% filter(n>1) 125 2 问题是，我想把它扩展回原来的样子，但使用这个过滤器。

浏览 0提问于2017-07-28得票数 14

回答已采纳

1回答

使用dplyr中的组长度创建新列

、

我正在尝试创建一个新的数据框，它由一个列(即下面的Petal.Width )分组，并具有从另一个变量(即物种)的组创建的新列，以及来自每个物种组的观察值的数量。我假设dplyr能够做到这一点，但是我不能完全得到我需要的东西。我试过这个代码，但它返回物种中所有观察值的长度，而不是每组的长度(即所有列都有相同<em

浏览 12提问于2019-08-24得票数 0

1回答

根据另一个数据提取群的第一个N个观测值

、、、

我想从数据中提取不同群体的第一批观察结果。观测的数量来自另一个数据。下面是一个例子:在dataframe "x“中，有不同种类的动物的名字。，加上我希望对各自组进行的观察的数量。，对猫第一次观察，对猫第一次观察，对狗第一次观察，对鸟类最后第一次观察前两次。dplyr，按“动物”分组，然后使用head

浏览 4提问于2022-04-02得票数 2

回答已采纳

1回答

可以为R中的mvrnorm( )随机生成的数字指定一个范围吗？

、、、

我正在尝试生成一组随机的数字，这些数字精确地反映了我拥有的数据集(以测试它)。数据集由5个变量组成，这些变量都与不同的均值和标准差以及范围(它们是likert标度相加形成1个变量)相关。我已经能够从MASS包中获得mvrnorm来创建一个数据集，该数据集复制了具有观察到的观测值数量的相关矩阵(在500,000+迭代之后)，并且我可以轻松地重新分配均值和标准差。dev.通过z分数转换，但我仍然在每个变量向量中有特定值，

浏览 0提问于2013-07-07得票数 1

回答已采纳

1回答

合并具有相同ID但变量重叠的行

、、、

我在r中有超过6000个观察值和96个变量的数据。数据包含个人数量、活动、影响、到达时间等。问题是，一些观察结果被分成两行，因此可能存在在另一行中为同一组记录的</

浏览 14提问于2020-02-03得票数 0

回答已采纳

2回答

不平衡数据集的变量创建

我有一个数据集，其中的观测值是ID year event_type event_date。每个ID year的观察值数量不平衡。具体地说，这些都是冲突年份内的战斗结果。我想做的是根据ID year的子集内特定类型的事件数量创建一个变量。所以：作者：year我知道如何使用常规的f

浏览 1提问于2012-03-06得票数 0

回答已采纳

1回答

根据另一个变量的中位数创建二进制变量，按两个变量分组

、、、、

在Stata中，我想根据另一个变量median_unemp的中值创建一个二进制变量unemp，将中值的计算按region和year分组。也就是说，当特定观测值的失业率大于该地区和观察年份的失业率中位数(否则为0)时，median_unemp为1。考虑到整个数据集，下面的代码生成我的变量，但我希望通过子组(由region和year计算)计算中间值： webuse productivity.dta, c

浏览 6提问于2021-12-14得票数 0

回答已采纳

点击加载更多