R dplyr的group_by也考虑了空组 - 腾讯云开发者社区

、、、

为了在R中选择日期列的“第一次”出现，我有时使用这样的代码： data %>% group_by(id) %>% arrange(eventdate) %>% slice(1L) 问题是:它接受日期的第一个匹配项，即使它之前有一个空单元格。添加一个过滤器或函数来打印那个空的/ eventdate /单元格而不跳转到下一个eventdate单元格，最好的解决方案是什么？谢谢

浏览 16提问于2020-04-22得票数 0

回答已采纳

2回答

如何基于两个变量对数据进行子集

、

我有一个如下所示的数据集(因为有R，所以它是长格式的)： Participant RT Session Testing_Condition 1 352 1 0 1 526 1 0 1 624 1 0 1 424 2 0 1 356 2

浏览 1提问于2019-08-05得票数 2

回答已采纳

1回答

如何以优雅的方式将每组变量的平均值添加到列中？

我想将每月平均温度作为列添加到空气质量数据集中。所以，我想要这样的东西： Ozone Solar.R Wind Temp Month Day NEW COLUMN 41 190 7.4 67 5 1 77.9 36 118 8 72 5 2 77.9 12 149 12.6 74 5 3 77.9 18 313 11.5 62 5 4 77.9 NA NA 14.3 56 5 5 7

浏览 11提问于2019-09-28得票数 1

1回答

RStudios - Dplyr -使用聚合，如何获得与我所遵循的指南类似的输出？

、、

我试着用r工作室做一些twitter分析，我遇到了指南中的一个特定部分，它将几个专栏合并在一起。在这里，我分组了人的名字，并总结了用户，追随者和朋友的平均值。在指南上，它显示了但是，当我试图在r工作室上重复完全相同的代码时，它将显示以下输出。为什么它不显示"screen_name“列，并且以某种方式取所有行的平均值？

浏览 1提问于2020-11-26得票数 1

回答已采纳

2回答

计算组是指在dplyr和data.table中没有观察到的类别。

、、

我有一个具有数值变量和分组变量的数据集，并且希望计算组方法。有些组是空的，即在数据中没有出现一些因素级别。在计算分组方法时，我希望这些空组与非空组一起列出。这是很容易实现的使用基数R： # Create an example of a data frame where variable1 is numeric and variable2 is a # factor with three levels, two of which appear in the data: df <- data.frame(variable1 = c(1,2,3,4), variable2 = factor(c

浏览 5提问于2020-05-04得票数 1

回答已采纳

1回答

计算平均时间(H:M)差，从每一组的时间间隔每天在R。

、、

我有一个如下所示的数据集： id gr dt.DMYMS dt.DMYMS.pos 1 A R21 01/03/19 05:39 2019-03-01 05:39:00 2 A R21 01/03/19 05:42 2019-03-01 05:42:00 3 A F23 01/03/19 06:23 2019-03-01 06:23:00 4 A F23 01/03/19 06:26 2019-03-01 06:26:00 5 A F23 01/03/19 06:28 2019-03-01 06:28:00 6 A F24 01/03/19 07:0

浏览 4提问于2021-04-28得票数 0

回答已采纳

1回答

列表示具有唯一值的行

、、、

如何从共享相同lon、lat字段的行中计算平均R、R1、R2、R3值？我相信这个问题存在很多次了，但我很难找到。 lon lat length depth R R1 R2 R3 1 147.5348 -35.32395 13709 1 0.67 0.80 0.84 0.83 2 147.5348 -35.32395 13709 2 0.47 0.48 0.56 0.54 3 147.5348 -35.32395 13709 3 0.43

浏览 4提问于2017-09-27得票数 0

回答已采纳

2回答

R:计算每个类别的观察次数

、、、

我目前从R开始，想知道如何从下面的数据集中计算每天每个节点每个复制的观察次数，并将其存储在不同的数据集中。原始数据集如下所示： 📷 希望生成的数据集如下所示： 📷 有人能帮我找出我怎么能在R里做到这一点吗？谢谢

浏览 0提问于2020-07-02得票数 1

2回答

时间序列过滤是否可在ggplot中使用？

、、、

我有多个时间序列的R数据帧。数据框架由3列数据组成: test、timeHr和range。 test列指定所执行的测试的实际名称，范围提供一个特定于特定小时的数值(由timeHr表示)。我想要做的是，如果一个特定的时间序列在任何时间点超过了一个上限和/或一个下限，那么它将从最后的timeHr图中被省略。下面是一些示例代码，只显示了2个时间序列： library(ggplot2) test <- c("A", "A", "A", "A", "A", "B", "B",

浏览 5提问于2020-04-08得票数 1

回答已采纳

1回答

将重复值复制到新列中

、

我有一个问题，复制一些熊猫的东西给R。我希望将具有相同订单ID的复制产品合并到一个新列中。熊猫就是这样做的。是我干的还有这个我在这两方面都犯了错误。任何帮助都将被应用。我拿出了扩散函数，得到了这个： Group_Product列中没有值，只是<S3: grouped_df>。我该怎么解决呢？

浏览 2提问于2022-05-02得票数 0

回答已采纳

1回答

识别R中数据点之间分类数据的变化

我需要关于R中数据操作的帮助。我的数据集如下所示。 Name, country, age Smith, Canada, 27 Avin, India, 25 Smith, India, 27 Robin, France, 28 现在，我想仅根据姓名和国家/地区的组合来确定“Smith”经历了(两次)更改的次数。基本上，我希望将每个数据点与其他数据点进行比较，并仅针对名称和国家/地区的组合确定整个数据集中发生的更改的计数。

浏览 5提问于2018-04-16得票数 1

1回答

为多个样本组创建大小为n的随机子样本。

我有一个大的数据集的样本，属于不同的群体，并在所涵盖的地区不同。数据集的结构简化如下。我现在想为每一组创建集合样本(子组)，其中每个子组所涵盖的区域等于指定的区域(例如20)。样本应该被随机分配，不需要替换给每个子组，子组的数量应该在数据帧末尾的一个新列中列出。 SampleID Group Area Subgroup 1 A 1.5 1 2 A 3.8 2 3 A 6 4 4 A 1.9 1 5 A 1.5 3 6

浏览 0提问于2018-10-24得票数 0

回答已采纳

2回答

如何选择在R中数据表的列中只出现一次的值？

和标题一样，这个问题很简单。(原谅我的无知) 我在数据表中有一个列，字符类型。存储了几个不同的单词/值，其中一些只出现一次，另一些则多次出现。如何选择只出现一次的？？任何帮助都是非常感谢的！谢谢!

浏览 1提问于2019-09-24得票数 1

3回答

通过比较R中的其他两列来选择组

、、

我有一个像这样的数据文件： date.x dol PIFF_ID event <date> <date> <dbl> <dbl> 1 2018-02-22 2018-04-03 371700 NA 2 2018-02-23 2018-04-03 371700 NA 3 2018-02-24 2018-04-03 371700 NA 4 2018-02-25 2018-04-03 371700 1 5 2018-02-26 2018-04-03 371700

浏览 0提问于2021-05-03得票数 2

回答已采纳

1回答

将每个值与分组的平均值进行比较

这是我的数据框： id kind subject price 1 1 one 200 2 1 one 100 3 2 two 200 4 1 three 200 5 2 two 100 我需要添加另一个具有逻辑值的列，比较(对于每个id)价格和具有相同主题的组内价格的平均值。为了得到这样的东西： id kind subject price less_than_mean 1 1 one 200 FALSE 2 1 one 100 TRUE 3 2 two 200 FALSE 4 1 three 200 TRUE 5 2 two 100 TRUE 对于大型数据集，最强大的决策是什么？

浏览 3提问于2017-02-27得票数 1

1回答

对数据帧中的相同元素进行计数

、、

在r数据帧上又遇到了一个问题。 #starting position from <- c("A","B","A","C") to <- c("D","F","D","F") number <- c(3,4,6,7) data.frame(from,to,number) 如何计算两个相同的"from- to“关系(从A到D)的个数？结果应该看起来像我的“结果”数据帧。 #result from <- c("A","

浏览 1提问于2018-04-20得票数 0

1回答

我如何分解重复的数据，并在我的数据框中添加一列来计算r中分解的数量？

、、、、

我需要关于如何基于r中的共性来融合多个列的帮助，并且还需要向数据框架添加一个新的列来反映溶解的数量。我没有包含在下面的模拟数据中，但是y和z数据在每列中都是不同的。我也有几百行。 #My data now x y z A A A A B B B B B B C C C C C #How I want my data to look x y z q A 4 B 6 C 5

浏览 29提问于2019-05-01得票数 0

回答已采纳

1回答

如何将lm()应用于按因素拆分的数据集

、

在住房数据集中，有三个变量，即bsqft (房屋的建筑大小)、县(9个级别的因素变量)和价格。我想拟合一个单独的回归线使用bsqft和价格为每个单独的县。与其重复调用lm()函数，我更喜欢在r中使用apply函数，但不知道如何创建它。有人能帮我吗？非常感谢。

浏览 0提问于2018-04-30得票数 0

回答已采纳

1回答

为for循环中的子集创建“范畴”变量

、、

我希望将一个操作放在一个for循环中，以便将该操作应用于每个子集。目标是创建一个for循环，为变量"State“生成子集，然后为每个子集中的每个条目分配分位数值(1:4或0-25%、25%-50%、50%-75%、75%-100%)。这是有点难以解释，所以这里有一个例子。我的数据如下所示： data <- data.frame(data) State Summer_Temperature CA 72 NY 84 TX 91 NY

浏览 2提问于2019-10-04得票数 1

回答已采纳

1回答

查找多个测试中表示的组

、、

在R中，我有三个条件中的一个发生的事件对，并希望找到在每个条件下发生的事件对。例如： label1 label2 factor value bob ted A 4 bob carol A 3 ted carol A 2 bob ted B 3 ted carol B 4 bob ted C 2 bob carol C 9 ted carol C

浏览 0提问于2018-06-04得票数 2

回答已采纳

1回答

ddply将R中的data.frame上的文本数据相对于单个列进行压缩

、、

我有一个名为df的数据帧，其结构如下： X C D E F A b c d e A f g h i B l m n o B p q r s 我想要得到这样的结果： X C D E F A b f c g d h e i B l p m q n r s o 我可以使用ddply，就像这样: test <- ddply(df，"X"，...) 我不知道如何完成它。你能帮我一下吗？谢谢!

浏览 2提问于2017-05-29得票数 0

1回答

合并R中的多行

、、、

我目前有一些数据，人们在这些数据中回答了有关行为的问题。一些问题是关于过去和现在的行为(都是条件)的总体陈述，以及针对某个问题框架(条件x和y)被问到的关于行为的其他问题。我想要合并这些行，这样每个参与者都有两行。一行将有他们对条件的所有答案标记为“两者”，而对条件“x”的答案将被标记为“”，另一行将对条件的所有答案标记为“两者都有”，并回答条件“y”。我尝试过几个分组解决方案，但似乎无法让它工作。也看了这些答案：这两种方法都不起作用。下面的示例代码。感谢你的帮助，因为目前我只能在excel中复制粘贴，这并不理想。 library(tidyverse) a <- tib

浏览 7提问于2021-12-06得票数 2

1回答

根据另一列的值分配给一列的非循环方式

、、

我想要根据另一列的值，从一个不同的dataframe中填充缺少的值。我正在使用R中的一些清理操作，并且使用这个Kaggle 中的“”文件我想要做的是用运动员参加的运动项目的平均年龄替换掉每个运动员年龄列中缺失的值。我还是个新手，所以可能会有一些多余的代码。但首先我在文件里读到： olympic_tbl = read_csv("athlete_events.csv", n_max = 500) 然后，我创建了一个名为"mean_sport_age“的新数据，其中包含两列--运动和运动员的平均年龄。我将行标签更改为“体育”名称，并更改列名，以便于索引。 mean_s

浏览 0提问于2019-07-10得票数 0

1回答

用控制组的方法对几个子组中的每个子组进行整个数据的划分。

、

起动数据我在R工作，我有一套数据来自不同剂量的不同药物治疗的动物群(队列)。下面是我的数据集的一个可复制的简化示例： # set starting values for simulation of animal cohorts across doses of various drugs with a few numeric endpoints cohort_size <- 3 animals <- letters[1:cohort_size] drugs <- factor(c("A", "B", "C")) doses &l

浏览 1提问于2020-07-01得票数 2

回答已采纳

2回答

计算列子集的平均值

、、

我不知道如何计算R中某一列的子集的平均值。我的特别问题是计算“年龄”40+和<40的“支出”。我试过了 mean(expenditures[["age">=40]]) 并获得了成功，但是 mean(expenditures[["age"<40]]) 没有成功。因此，我被这个问题卡住了。在这个看似简单的问题上，我将非常感谢大家的帮助。

浏览 0提问于2018-08-21得票数 0

1回答

R devtools：：没有提到检查许可证和描述文件中的其他问题

、

开始创建包时，我构建了几个函数，然后运行devtools::check()，以确保我已走上正轨。下面我复制devtools::check()命令的整个输出。有两个音符让我吃惊。我希望通过清理这两件事，其他的事情会变得更容易解决，所以我从它们开始。我不是试图解决所有的问题，从检查，只是试图理解这两个。第一个问题是：描述文件中没有提到文件许可证。另一个是后来者检查R代码是否可能出现问题(3.7s) 其中有许多消息“没有可见的全局函数定义”，尽管这些函数在描述文件中导入的包中。下面是描述文件。整个可复制的代码可以在中找到。之后是devtools::check命令的输出。 Pa

浏览 0提问于2019-05-12得票数 10

1回答

如何从csv计算数据组的RMSE

、

我是R的新手，我想计算保存在同一个.csv文件中的两组数据的均方根。 .csv包含如下内容： Group X Y A 2 2 A 3 2 B 2 7 B 6 5 我仅为A组中的人检索RMSE的失败尝试： myData=read.csv("foo.csv") attach(myData) library(Metrics) if (row.names(A)) { rmse(x,y) } 在我计算RMSE之前，我需要附加A和B来分离数据帧吗，或者有更好的方法来实现这一点吗？提前感谢！

浏览 14提问于2019-01-12得票数 1

回答已采纳

2回答

dplyr::group_by()或just > group_by()

、、、

我进入了编程语言R，我想知道dplyr::group_by()和group_by()之间的区别?这个操作符“：”做什么？谢谢!

浏览 9提问于2022-05-01得票数 0

2回答

得到R中数相同的范围的最后一项，向量化

我有这些数据： tribble( ~ranges, ~last, 0, NA, 1, NA, 1, NA, 1, NA, 1, NA, 2, NA, 2, NA, 2, NA, 3, NA, 3, NA ) 我只想在last列的最后一个条目的行索引处填充ranges列。也就是说，它应该是这样的： tribble( ~ranges, ~last, 0, 0, 1, NA, 1,

浏览 2提问于2022-02-09得票数 1

回答已采纳

1回答

R代码，用于将年龄划分为多个范围，并根据另一个分类变量获取该年龄范围内的人口计数

我想将年龄划分为如下范围 25<Age<=35,35<Age<=45,45<Age<=55,55<Age<=65,65<Age<=75,75<Age<=85 然后计算在这个年龄段有心脏病的人数。我该怎么写这个的R代码呢？

浏览 5提问于2017-05-01得票数 0

3回答

基于组和指定文本的有条件删除行

、

我早些时候发布了一个关于按组求和值的，不包括NA或text以下的值。这个问题类似，但我不想按组进行求和，而是删除按id分组的特定文本(本例中为end)下的所有值(本例中为name)。例如, 我想从这里出发： #Starting df name = c("tom", "tom", "tom", "chris", "chris", "chris","chris", "jen", "jen", "jen","jen","

浏览 1提问于2017-11-12得票数 3

回答已采纳

1回答

如何选择按其他变量排序的最小真值

、、、

我有一个非常大的数据集，按设施编号、年份和月份排序。在最后一列中，我有一组正确/错误的陈述。我设置了最后一列，以便对于每个唯一的(设备编号、年份和月份)集合，该列将从FALSE开始，但转换到TRUE处的某个点(在我的程序中的其他地方确定)。我希望在最后一列从FALSE切换到TRUE的每个唯一集合(设备号、年和月)中找到最小行数。以下是该表的示例： fac_num year month t 1: 1 2017 1 FALSE 2: 1 2017 1 FALSE 3: 1 2017 1 FALSE 4

浏览 8提问于2017-07-06得票数 0

回答已采纳

2回答

R中Dataframe中元素的困难减法

、、

我有以下数据帧： CA UNIT SCP DATE TIME DESC ENTRIES EXITS (chr) (chr) (chr) (chr) (chr) (chr) (dbl) (dbl) 1 A002 R051 02-00-00 03-10-13 04:00:00 REGULAR 4026243 1386869 2 A002 R051 02-00-00 03-10-13 08:00:00 REGULAR 4026273 1386886 3 A002 R051 02-00-00

浏览 1提问于2016-05-12得票数 0

1回答

过滤器计数不同>1

、

嗨，我有如下所示的df： ID | Gender 1 | M 1 | F 2 | F 2 | F 2 | F 3 | M 3 | M 3 | F 4 | M 4 | M 4 | M 我想不同的过滤器ID，它有超过1种性别(过滤不可能有超过1种性别的脏数据)结果应该是： ID | Gender 1 | M 1 | F 3 | M 3 | F 我如何在R中使用dplyr？

浏览 5提问于2020-02-07得票数 2

回答已采纳

1回答

如何使用基R或dplyr计算数据帧中元素的子集？

、、、

我想在下面的数据帧nCode中添加一列，调用所需的新列"grpRnk"，它计算每个组的级别(定义为Group值<> 0的组)在数据帧中的其他组中，顶级定义为该分组行的最低关联nmCnt，然后随着其他分组行的nmCnt增加而从那里降序。正如在下面的数据帧输出中手动添加到最右边的列("grpRnk ADD")中所描述的： > print.data.frame(nCode) Name Group nmCnt seqBase subGrp grpRnk ADD 1 B 0 1 1 0 0 sinc

浏览 2提问于2022-09-16得票数 0

回答已采纳

2回答

如何在聚合表达式中使用每个“当前行”值作为条件参数

我希望通过按和条件聚合我的表生成一个相应的值(在新的最后一列中)，在此条件和计算中使用每个对应的行值中的一些：示例：所有“秒”之和，如果“第一”等于当前第一值(A)，“第二”等于当前第二值(5) 在Excel中，我们通过轻松使用当前行的地址和通过拖动扩展公式来解决当前行。在poweBI/DAX中，我们使用前面的函数来引用当前的行值。我不知道我应该在R里做什么。

浏览 1提问于2020-03-31得票数 0

回答已采纳

1回答

在R中使用Shapiro检验的不同结果

、、

我有一个包含两个因素的独立样本t检验的大量数据，其中一个是性别。我想让它检查变量中每组的正态性，以决定下一步。因此，我采用了我在这个论坛中找到的以下脚本，并进行了一些修改。 for (i in 9:ncol(AF)) { print(names(AF)[i]) print(AF %>% group_by(Gender) %>% summarise(`W Statistic` = ifelse(sd(AF[, i])!=0, shapiro.tes

浏览 19提问于2021-08-20得票数 0

2回答

R中数据框中的条件子集

、

我在R中有一个数据框，看起来像这样： Id group category number 001 1 A 0.10 001 1 B 0.15 002 2 A 0.55 003 3 A 0.75 003 3 B 0.45 现在，我希望每个Id只有一行。对于groups 1和2中的Id，应主要使用category为B的行。如果groups 1或2没有category为B的行，则应使用category A。对于group为3的Id's，应始终使用

浏览 14提问于2020-11-16得票数 0

回答已采纳

2回答

如何为每个条件选择第一个实例？

、

很棒的堆栈溢出的人！我在纠结我的R代码。我有一大群人都去过很多医院--我想得到的是每个人的每种疾病的第一个病例。在删除重复项后，我有6613个观察值，我的数据集中有1306个唯一id。因此，我知道我需要至少有1306例初发疾病，而且可能更多，因为有些人有多种共病。我已经按病人安排了，然后按日期安排了。例如：What my dataset looks like 因此，对于0001号患者，我希望得到他们的第一例心绞痛、慢性IHD以及他可能遇到的任何其他问题(实际上，一些患者需要17次住院，其中大多数人都会重新诊断。我已经尝试了在StackOverflow上找到的几个解决方案，但我得到了35

浏览 43提问于2021-04-21得票数 0

2回答

复制dplyr引用和引用示例

、、、

我很难复制中的示例。这是我的代码和会话信息。今天我花了太多的时间去寻找错误的线索，并重新安装软件包。任何帮助都是非常感谢的。 library(dplyr) df <- tibble( g1 = c(1, 1, 2, 2, 2), g2 = c(1, 2, 1, 2, 1), a = sample(5), b = sample(5) ) my_summarise <- function(df, group_by) { group_by <- enquo(group_by) print(group_by) df %>% group_by

浏览 0提问于2017-10-03得票数 0

回答已采纳

1回答

关于创建累积变量的建议

、、

当涉及到使用R操作数据时，我是相对较新的。我想在我的数据框架中创建一个新列，它创建一个累积变量，我假设有一些方法可以用dplyR来实现，但对它没有太大的经验。他是一个典型的数据框架。 Group X Y A 0 0.00 A 1 0.12 A 4 0.02 A 10 0.07 A 17 0.41 B 0 0.00 B 3 0.06 B 18 0.13 B 25 0.20 B 32 0.10 在这种情况下，我想为Y创建一个累积变量的列。 Group X

浏览 2提问于2022-05-09得票数 0

1回答

使用for循环从拆分生成的列表中提取和导出数据帧。

、、

我是R的新手，对蟒蛇有一定的经验。我需要将数据分割成42块，但结果给了我一个列表，所以现在我需要从列表中提取和导出每个数据。我想使用一个循环(在python中可以这样做，但我无法让它工作。)我希望你能帮我。 num_groups = 42 lista <- RSI_SGR1702_MAYO %>% group_by((row_number()-1) %/% (n()/num_groups)) %>% nest %>% pull(data) # Loop for(i in (1:42)){ RSI_SGR[[i]] <- as.data.frame

浏览 1提问于2022-02-18得票数 0

1回答

R中按群划分的Benford定律

、、

我试图在所有供应商的发票上使用R中的benford.analysis包来实现Benford定律。在整个数据集中，数据确认。我试图找到一种方法，按供应商分组，以确定是否有个别供应商通过不符合规定显示欺诈指标。是否有办法打破不合格的团体？

浏览 3提问于2022-06-27得票数 1

回答已采纳

1回答

为什么dplyr中的独立group_by似乎没有做任何事情？

、、

我有一个像下面这样的df； set.seed(1) No <- rep(seq(0,95,1),times=21) AC <- rep(rep(c(78,110),each=1),times=length(No)/2) AR <- rep(rep(c(256,320,384),each=2),times=length(No)/6) AM <- rep(1,times=length(No)) DQ <- rep(rep(seq(0,15,1),each=6),times=3) V <- rep(seq(100,2100,100),each=96) R &l

浏览 0提问于2015-07-26得票数 0

回答已采纳

1回答

根据R中不同ID的条件聚合两行

、

我正在处理一项运动的运动员统计数据集。数据中有一个错误，一个星期一个不存在的球员被归因于一个真正的球员的数据。我需要聚合两个玩家的数据并删除false玩家行的实例。我需要调整我的预处理代码来适应这种情况，这样当我抓取未来几周的数据时，我就不需要进行手动调整了。 df <- data.frame(Name = c("Bob","Ben","Bill"), Team = c("Dogs","Cats","Birds"), Run

浏览 7提问于2020-02-19得票数 0

3回答

R dplyr:按组过滤常用值

、

我需要找到不同组之间的共同值，最好使用dplyr和R。从我这里的数据集中： group val <fct> <dbl> 1 a 1 2 a 2 3 a 3 4 b 3 5 b 4 6 b 5 7 c 1 8 c 3 预期输出为 group val <fct> <dbl> 1 a 3 2 b 3 3 c 3 因为在所有组中只出现数字3。这段代码似乎不起作

浏览 17提问于2020-12-02得票数 3

回答已采纳

1回答

R选择数据框中的所有行，其中值在一列中重复，但在另一列中具有特定值

、、、、

我正在尝试从R数据帧中提取在一列中具有重复值，但在另一列中具有0或1的行。例如，如果这是数据帧： Data <- data.frame( + X = c(1,3,5,7,7,8,9,10,10,11,11), + Y = sample(36476545:36476555), + timepoint = c(0,1,0,0,1,1,0,1,0,1,1) + ) 看起来像是 > Data X Y timepoint 1 1 36476549 0 2 3 36476545 1 3 5 36476552

浏览 24提问于2019-02-08得票数 1

回答已采纳

1回答

由一组人在DF中组织和获取平均值。R

、、

我有以下数据结构： iid <- c(rep("I1", 5), rep("I2", 5), rep("I3", 5), rep("I4", 5)) days <- c(-2,-3,0,-1,-5,-1,1,2,1,1,-2,2,2,-3,8,0,0,0,2,1) val <- c(22,30,41,52,21,32,41,54,21,45, 11,10,12,15,58,55,32,68,74,85) data <- data.frame(iid = iid, days = days,

浏览 0提问于2021-06-08得票数 0

回答已采纳

1回答

突变成组的值(如条件均值)

、

使用dplyr和R，您可以使用group_by和汇总来聚合数据。例如： mpg_cyl_carb <- mtcars %>% group_by(cyl, carb) %>% summarise(var1 = mean(mpg)) head(mpg_cyl_carb, 3) A tibble: 3 x 3 Groups: cyl [2] cyl carb var1 <dbl> <dbl> <dbl> 1 4 1 27.6 2 4 2 25.9 3 6 1

浏览 3提问于2021-12-29得票数 1

回答已采纳

1回答

dplyr 1.0.2中的summarise()类似于mutate()

、、

给定一个列出用户、产品和产品功能的tibble，我尝试计算拥有特定产品功能的不同产品用户的比例： library(dplyr) #> #> Attaching package: 'dplyr' #> The following objects are masked from 'package:stats': #> #> filter, lag #> The following objects are masked from 'package:base': #> #> inte

浏览 15提问于2020-10-24得票数 0

回答已采纳