通过另一列中非NA值的总和设置df子集

，可以使用pandas库中的DataFrame来实现。下面是完善且全面的答案：

在pandas中，DataFrame是一个二维的数据结构，可以理解为一个表格，其中包含了多个行和列。要通过另一列中非NA值的总和设置df子集，可以按照以下步骤进行操作：

导入pandas库：

import pandas as pd

创建一个DataFrame对象：

df = pd.DataFrame({'A': [1, 2, 3, None, 5],
                   'B': [6, None, 8, 9, 10],
                   'C': [11, 12, None, 14, 15]})

这里创建了一个包含3列的DataFrame，其中列'A'、'B'、'C'分别包含了一些数值和缺失值（用None表示）。

计算另一列中非NA值的总和：

total_sum = df['B'].sum()

这里计算了列'B'中非NA值的总和。

设置df子集：

subset = df[df['B'].notna() & (df['B'].sum() > total_sum)]

这里使用了布尔索引，通过判断列'B'中是否为非NA值，并且该列的总和是否大于之前计算的总和，来筛选出满足条件的子集。

最后，可以打印输出子集的内容：

print(subset)

以上就是通过另一列中非NA值的总和设置df子集的完善且全面的答案。

在腾讯云的相关产品中，可以使用腾讯云的云数据库MySQL、云数据库CynosDB等产品来进行数据存储和处理。具体产品介绍和链接地址可以参考腾讯云官方文档：

通过另一列中非NA值的总和设置df子集

、、

NA cana157 001012 NA cana157 001022NA cana157 001032 NA cana157001061 NA

浏览 15提问于2020-05-27得票数 0

1回答

当存在NA时，如何在因子级别上子集数据帧

、、

我想在因子水平上设置数据帧的子集，但当NA存在时，我很难做到这一点。下面是两个比较数据帧，一个在factor列中没有NA，另一个有NA df1 <- data.frame(v = c("ABC", "def", "ABC", "ghi"),例如： df1[!df1$v == "ABC",]

浏览 23提问于2020-03-26得票数 1

回答已采纳

1回答

设置工作日和周末数据集的子集，并计算列的总和

、、、

我的数据框如下所示：我已经使用以下命令创建了所有周的总和：df[366,(3:27)] <- colSums(df[,3:27], na.rm= T)## calculate number of missing values in a column NA.find <- func

浏览 0提问于2012-04-02得票数 1

回答已采纳

3回答

选择在R中不包含任何NA值的列

如何选择R中不包含任何NA值的列？只要一列至少包含一个NA，我就想排除它。做这件事最好的方法是什么？我正试图使用sum(is.na(x))来实现这一目标，但并没有成功。 column1 column2row2 a c row3 a c

浏览 1提问于2014-06-13得票数 1

回答已采纳

4回答

计算列中的值作为同一行位置上一个列值的函数

、、

我有许多列，我想根据函数(1 + x) ^ k来计算值，其中x是来自特定列的值，k是我们试图计算的列的索引。我只想对表中所有列的子集进行计算。例如： df = data.frame(A = c(0.1, 0.05, 0.2), B = c(1, 1, 1), C = c(NA, NA, NA), D = c(NA</em

浏览 3提问于2020-08-17得票数 2

1回答

用NA值子集data.frame时'==‘的R行为

、、

我有一个看似简单的问题，我正在努力解决。考虑这个例子：df$ID[df$ID %in% "A"]df$ID[df$ID == "A"] 返回A <NA>。我知道我可以通过</e

浏览 0提问于2018-01-19得票数 0

回答已采纳

2回答

如何做R中几个变量之和的均值

、

例如:第一个的比率是2/3=0.66。第二个问题的答案是相同的。关于第三个，我需要除以2，因为-99缺少值，并且答案应该是1/2=0.5。我该怎么做呢？

浏览 0提问于2015-11-22得票数 1

1回答

R编程: dataframe$column[<boolean>] = <value>是如何工作的？

、

这colnames(df) <- c("values", "pos_neg")df$pos_neg[flag] = "negative"给了我这个并且它的工作方式与预期<e

浏览 0提问于2018-05-28得票数 1

1回答

R:将多个列从[1,2]转换为布尔[TRUE，FALSE]

、、

我有一个数据框架(与read.csv一起导入)，它有许多列，但不是所有列，这些列的布尔数据编码为1=false，2= true。data$someCol <- data$someCol == 2 我可以通过grep选择这样

浏览 2提问于2015-07-31得票数 1

回答已采纳

2回答

将行的最后一个nonNA值添加到新列中

、、、

我有一个像这样的数据文件： NA NA NA 0 1 NA0 1 2 column4 0

浏览 0提问于2020-08-03得票数 0

回答已采纳

1回答

使用其他具有min/max值的数据集将子集函数应用于列

、、、

我正在尝试将子集函数应用于每个列，其中包含来自另一个数据集的最小值和最大值。最小可重现性示例：两栏的最小/最大限值： Names Min

浏览 1提问于2020-03-27得票数 0

回答已采纳

1回答

具有字符串R的数据帧子集

、、、

我正在通过在dataframe的一个列中选择一个string条件来尝试一个dataframe子集。这应该是一个简单的任务，我看到它已经问过很多次了，但我完全被困住了。Uncertainty = c("0.0587455625228403", NA" ), Sy =

浏览 2提问于2021-10-13得票数 0

回答已采纳

1回答

如何组合两个列(Name.x和Name.y)，这些列是从公共列合并数据集的结果？

、、

我对R是新手，我真的被困在可能是一个非常简单的任务上。我已经通过一个公共列(唯一ID)合并了两个数据集。这是很好的，但是在两个数据集中都有一些列，这导致了两列(Name.x和Name.Y)。我想将Name.Y中的信息移动到Name.X列，然后删除Name.Y列。基本上，我想将Name.X中的NA替换为Name.Y中的名称。我尝试过使用is.na函数，但它不起作用：

浏览 2提问于2020-07-09得票数 0

回答已采纳

2回答

设置多列NA取值范围(仅限于base和car套餐)

、、

如何在R中仅使用base、car和外部包对数据集进行某种形式的批量重新编码？我使用的是一台政府计算机，所以我不能安装任何额外的软件包来简化这项工作。理想情况下，我希望能够为car的重新编码函数提供数据帧，或者将重新编码函数应用于数据帧中的所有/大多数变量。这个想法看起来像下面这样，尽管这段代码不能工作：df<-recode(df[2:92], '98:100=N

浏览 0提问于2011-08-17得票数 1

回答已采纳

1回答

如果值存在于其它列中，则将值赋给列

、

第一个问题col_1 <- c(1, NA, 2, 3)col_3 <- c(3, 2, 3, NA) 3 2 NA col_1 col_2 col_

浏览 3提问于2017-08-25得票数 1

3回答

将Stata代码转换为R

、

=civil, NA, EDIT:举个例子><- data.frame(b,c) > df$j <- ifelse(df$b==n-

浏览 1提问于2014-11-04得票数 1

1回答

R中列的条件求和

、、、

我需要一个快速提示如何计算所有列(这里称为A，B，C)的总和，这些列大于或等于某个阈值(在列键中定义)。, NA, NA)for (i in 1:nrow(df)){ v

浏览 21提问于2020-12-13得票数 3

回答已采纳

2回答

当您有足够的信息来计算NA在R中应该是什么时，如何填充NA

、、、

我有一个数据集，其中有一些NA，但我可以手动计算出值应该是什么，因为df是一个名称的列，其余的列只是数字，后面是最后一列，总计。每一行最多只显示一个NA，因此我可以通过使用总计列和所有其他列的总和来计算值。只是想知道什么是最好的方式来填充这些NA，而不必一个一个地硬编码，因为我正在使用的<em

浏览 9提问于2022-02-09得票数 4

3回答

在R中的dataframe的任意列中查找部分匹配字符串

、

,"NA","CARGO")df<-data.frame(vessel,type, class4 d Cargo CARGO Underway 我想子集的df只包含那些与钓鱼有

浏览 105提问于2020-09-08得票数 1

回答已采纳

3回答

R:根据行范围选择行值

我有一个数据框架(df)，它包含4列值(V1到V4列)，需要根据另外两个列(max和min列)进行选择。我的目标是将NAs分配给每一行的max和min列设置的范围以外的值，并计算其余值的平均值。df$min, NA, df$V2) df$V3 <- ifelse(<em

浏览 6提问于2017-05-02得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

通过另一列中非NA值的总和设置df子集

相关·内容

通过另一列中非NA值的总和设置df子集

当存在NA时，如何在因子级别上子集数据帧

设置工作日和周末数据集的子集，并计算列的总和

选择在R中不包含任何NA值的列

计算列中的值作为同一行位置上一个列值的函数

用NA值子集data.frame时'==‘的R行为

如何做R中几个变量之和的均值

R编程: dataframe$column[<boolean>] = <value>是如何工作的？

R:将多个列从[1,2]转换为布尔[TRUE，FALSE]

将行的最后一个nonNA值添加到新列中

使用其他具有min/max值的数据集将子集函数应用于列

具有字符串R的数据帧子集

如何组合两个列(Name.x和Name.y)，这些列是从公共列合并数据集的结果？

设置多列NA取值范围(仅限于base和car套餐)

如果值存在于其它列中，则将值赋给列

将Stata代码转换为R

R中列的条件求和

当您有足够的信息来计算NA在R中应该是什么时，如何填充NA

在R中的dataframe的任意列中查找部分匹配字符串

R:根据行范围选择行值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐