计算按dataframe R中的另一个变量分组的最大连续重复非NA值_在R中按最大值分组的na.aggregate效率更高_计算连续值之间的差异或与R中向量中的最新非NA值的差异 - 腾讯云开发者社区

r、dplyr、count、rle

我想确定每个ADM2_PCODE的连续重复非NA Valor值的最大计数。因此，我们的想法是按ADM2_PCODE分组，过滤掉NA值，为每个Valor值计算连续事例的最高计数，并选择它们之间的最大出现次数。, NA, 30, 30, <em

浏览 26提问于2021-07-29得票数 0

回答已采纳

1回答

Revo，Scale R，rxCube和其他开源并行软件包？

r、parallel-processing、revolution-r

它有两列，my_id和my_rand变量。该数据帧有大约600万个唯一的my_id。我需要用my_rank (按my_id分组)计算平均值。avg_rank_by_id<-aggregate(dataframe1["my_rank"],by=dataframe1["my_id"], mean, na.rm=TRUE) 有没有办法运行Revo我是R的新手，除了Revo之外，

浏览 4提问于2015-07-06得票数 0

2回答

dplyr:如何在分组变量中忽略NA

r、dplyr、grouping、na

使用dplyr，我尝试按两个变量进行分组。现在，如果一个变量中有NA，但另一个变量匹配，我仍然希望看到这些行被分组，NA取非NA值的值。所以如果我有一个像这样的数据框： variable_A <- c("a", "a", "b", NA, &qu

浏览 1提问于2018-06-29得票数 1

2回答

在R中按行获得重复的连续值的摘要

r、apply、na、summary

我试图在R中逐行获得重复值的一些统计数据(最小、最大、平均)。我的dataframe看起来类似于以下内容： c(3,NA,NA,4,5,NA,7,6,NA,7,NA,8,9,NA,NA,4,6,NA,N

浏览 0提问于2018-05-04得票数 1

回答已采纳

3回答

从:按列计算非NA值，按其中一列分组

r、dataframe

我保证有更简单的方法来完成我的目标。我需要计算数据帧的非NA值，按所述数据帧中的一列分组。*这是我关于堆叠溢出的第一个问题，请耐心点。')litmus <- data.frame(grouping, column1, column2, co

浏览 2提问于2018-07-05得票数 2

回答已采纳

1回答

如何根据每个行中某些变量的单个平均值创建一个新变量？

我有以下数据：我想在R中做以下几点：预期产出(R)：以下是我尝试过的工作：我尝试创建一个for循环，循环遍历每一行，以计数非空白变

浏览 2提问于2020-08-12得票数 0

回答已采纳

1回答

消除数据集中的特定行

我有一个.csv格式的数据帧。该数据帧包括34500行。在此文件中，显示了RNAseq分析结果的列表。这里的问题是一些基因有多个结果，我应该为每个基因选择一个条目，这个条目应该具有最大的p值。我编辑了我的数据，我只有“基因符号”和“p值”信息。提前谢谢。

浏览 6提问于2019-08-05得票数 1

回答已采纳

2回答

同一组非连续记录行间的data.table差异

r、data.table、run-length-encoding

我需要计算变量的非连续记录之间的差异，按另一个变量分组。也就是说，我希望在运行中获取变量的最后一个值，并从下一次运行中的第一个值中减去它(如果有)。我知道我可以使用rleid和shift来计算连续行中的差

浏览 3提问于2017-08-31得票数 0

回答已采纳

2回答

R如何在group_by之后仅替换列中连续的重复值

r、group-by、duplicates

在下面的两列数据框中，我们如何通过按第一列分组来仅替换第二列中连续重复的值 df <- data.frame(A = c( 1, 1, 1, 2, 2, 3, 3, 3, 3, 3), B = c(100,100,200,100,200,200,200,300,300,200)) 对于组3，它将是200, NA, 300, NA, 200

浏览 30提问于2020-11-07得票数 0

回答已采纳

2回答

熊猫:如何删除重复行，但保留所有行的最大值

python、python-3.x、pandas、dataframe、pandas-groupby

如何删除重复行，但保留最大值的所有行。例如，我有一个4行的dataframe： data = [{'a': 1, 'b': 2, 'c': 3},{'a': 7, 'b': 10, 'c': 2}, {'a': 7, 'b': 2, 'c': 20}, {'a': 7, 'b&#x

浏览 0提问于2018-11-02得票数 4

回答已采纳

2回答

将具有相同列值的连续行组合起来

python、pandas

我有一个像这样的东西。

浏览 2提问于2014-08-06得票数 12

1回答

Pandas Dataframe中的列分组

python、pandas、dataframe

如果有人能帮我解决我遇到的熊猫数据问题，我将不胜感激。重复列Dataframe------------------01-01 | | 1 | 7 | 1 | | ---------

浏览 0提问于2017-02-22得票数 2

回答已采纳

1回答

地址范围的最小、最大和步长

python、pandas、range、sequence、street-address

我有一个包含16,000个地址的Pandas Dataframe，它们按街道和城市分组在一起。我需要找出地址连续范围之间的最小值、最大值和步长。例如，10号，12号，14号，16号大街。最小为10，最大为16，步长为2。问题是范围并不总是那么简单，有些不是真正的地址范围，而是沿街分布的地址。例如，大街4456,5567,6678。我希望能够识别连续的

浏览 27提问于2020-11-04得票数 0

回答已采纳

1回答

使用小于2个非NA值的svy分位数()

r、error-handling、survey

我试图计算由另一个变量分组的一个(或多个)变量的中值。我用的是svyby。问题是某些组的值可以小于2个非NA值。我使用这个函数将NA返回到小于2个非NA值的组，但它不起作用：exemplo <- data.frame(ID = 1:10

浏览 4提问于2014-09-17得票数 1

回答已采纳

1回答

时间序列缺失值估算:如何在na_kalman中使用最大间隙？

r、interpolation、missing-data、imputation、imputets

因为我只是在寻找一种方法，以避免对时间序列计算中的前导零点进行缺失值估算。由于前导零通常是时间序列中丢失值的最长序列，如果您使用全局模型预测面板数据，我希望使用maxgap参数来控制这些影响。最大间隙参数将连续NA的最大值设置为在估算过程中仍要替换的最大值。但是，如果我想避免替换任何大于1<

浏览 5提问于2021-12-08得票数 0

回答已采纳

1回答

如何通过条件突变添加新列，但保留原始数据？

r、dataframe、dplyr、count、mutate

我有一个包含500+行、50+列/变量的大型dataframe (df)，但只想以特定变量为目标。我想在原始的大型dataframe (df)中添加一个新的count列，其中包含任何非NA值的行和，特别是"targ_vars“中那些选择变量的行和。同样，我并不试图在每个变量中</em

浏览 1提问于2022-12-01得票数 0

回答已采纳

3回答

R群，计数非NA值

r、na

我有一个有NA散射的数据# Y X1 X2 Label# 3 NA 2 B# 2 NA 6 B# Label Y X1 X2# B

浏览 6提问于2016-12-14得票数 9

回答已采纳

1回答

如何在Python中将某些列值组合在一起，并使另一列中的值成为组合的值的手段？

pandas、dataframe、pandas-groupby

我有一个Panda dataframe，其中一列是一个数字序列(‘sequence’)，其中许多数字重复，而其他列值(‘binary variable')要么是1，要么是0。我已经按sequences列中相同的值进行了分组，并将binary变量中的列值设置为该组中非零条目的百分比。所以我的数据框看起来像这样： df =pd.DataFrame</

浏览 18提问于2020-09-20得票数 0

3回答

如果变量有重复值，则从dataframe中删除组。

r、dataframe、dplyr

我想问一下，是否有一种方法可以使用dplyr (或anz在该问题上的其他方式)从dataframe中删除一个组，其方式如下。假设我有一个按变量1分组的以下形式的dataframe：1 a2我只想删除变量2中有两个连续的相同值的

浏览 0提问于2018-05-10得票数 0

回答已采纳

3回答

在R中查找每组的累积最大秒数

我有一个数据集，我想在其中创建一个新变量，该变量是另一个变量的累积第二大值，并且我希望按组执行此函数。，cum2ndmax，它是var1的累积第二大值，我想按患者#对此变量进行分组，并访问#。我想出了如何计算累积的第二个最大值，如下所示： df1$cum2ndmax <- sapply(seq_along

浏览 41提问于2020-10-26得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云