在base R中有没有一种快速的方法来根据操作相关器对数据帧进行子集？(例如MPG >20)

在base R中，可以使用逻辑运算符对数据框进行子集操作。对于给定的数据框，可以使用条件语句来创建一个逻辑向量，并将其用作索引以选择满足特定条件的行。下面是一个示例：

# 创建一个示例数据框
df <- data.frame(MPG = c(18, 20, 22, 25, 28),
                 Model = c("A", "B", "C", "D", "E"))

# 使用条件语句创建逻辑向量
subset <- df$MPG > 20

# 使用逻辑向量作为索引选择满足条件的行
subset_df <- df[subset, ]

# 打印结果
print(subset_df)

这将输出满足条件（MPG > 20）的行：

  MPG Model
3  22     C
4  25     D
5  28     E

这种方法允许根据操作相关器（在这个例子中是MPG）快速筛选数据帧的子集。

对于这个问题，没有特定的腾讯云产品与之相关。此问题属于R语言的基本功能，与云计算相关性较低。

页面内容是否对你有帮助？

有帮助

没帮助

在base R中有没有一种快速的方法来根据操作相关器对数据帧进行子集？(例如MPG >20)

我相信使用Tidyverse这样的包可以更容易地处理这一点。然而，我试图通过简单地使用基数R来解决这个问题。为了说明这个问题，我使用了"mtcars“数据集。示例:仅针对MPG > 20的汽车的子集 1.)我的第一个直觉是尝试以下几点： mtcars[mtcars$mpg>20] 这并不令人惊讶，它不起作用。2.)其次，我意识到在使用以下命令时会得到输出： m

浏览 7提问于2021-01-12得票数 0

1回答

在R中映射2个不相关的数据帧

、、

我需要使用数据帧A中的数据来填充数据帧B中的一列。A 36 40 NA5 B 10 24 NA 我想要做的是根据来自数据帧A的数据填充B中的BelongToCount列，最终将数据帧<

浏览 21提问于2020-11-04得票数 1

2回答

R dplyr对只知道其字符串名称的列进行操作。

、、、、

我正在努力编写程序，在R中使用dplyr对数据帧的列进行操作，这些列只知道它们的字符串名。我的情况是，我只知道一个数据帧的列名，只有它的字符串名。因此，在函数或脚本中调用dplyr时，不能使用非标准的计算值，因为通常不能对未引用的(即“裸”)列名进行硬编码。在分析中，使用所使

浏览 3提问于2017-09-19得票数 3

回答已采纳

2回答

从符合特定条件的数据框中提取所有行

、

我在R中有一个数据框，其中一列包含状态缩写，如'AL'，'MD‘等。假设我想提取state = 'AL‘的数据，那么下面的条件dataframe'AL’似乎只返回一行，而这个状态有多行。有人能帮我理解一下这种方法中的错误吗？

浏览 20提问于2020-05-22得票数 0

回答已采纳

3回答

pandas使用自定义函数按索引对行进行排序

、

我经常需要处理数据帧，其中的行名(pandas中的索引)类似于[a-z][0-9]+类型(例如，'a20'，'a21'，...或'b1'，'b11'，'b2'，...)我希望能够仅根据数字对行进行排序。根据我对该应用程序接口的了解，df.sort_index()不接受我可以定义排序函

浏览 1提问于2018-02-06得票数 2

1回答

非常大的制表符分隔的文本文件的列选择

、、

我正在处理一个非常大的以制表符分隔(大约20000行* 30000列)的.txt形式的表，这使得文件大于20 tab。我检查了桌面的内存，似乎无法直接使用R中的read.delim或python中的pandas来读取该文件。我目前正在考虑基于列的过滤器制作表的一个小子集，新的文本文件将是20000行* 1200列。我已经将目标文件的列名保存在另一个文件中，我猜我的

浏览 34提问于2020-10-19得票数 0

回答已采纳

4回答

R:在数据帧的子集上快速执行操作，然后在没有内部函数的情况下重新聚合结果。

、

我们有一个非常大的数据帧df，可以被因素分割。在此拆分创建的数据帧的每个子集上，我们需要执行一项操作来增加该子集的行数，直到它是某个length为止。然后，我们对子集进行rbind，以获得更大版本的df。是否有一种无需使用内部函数就能快速完成此操作的方法？假设我们的

浏览 0提问于2016-01-28得票数 4

2回答

故障减法r数据帧

、、

我正在尝试对数据进行子集，以便当人员ID发生超过67次时，我根据人的实例发生的位置获取数据的子集，然后在该子集上运行一系列的回归。我知道如何让每个达到这67个阈值的人(使用table()来获取每个pid的计数)，但是如何根据他们的位置不知道位置得到数据帧的子集</em

浏览 1提问于2016-04-25得票数 0

回答已采纳

1回答

大型数据帧( pyspark)上的EMR笔记本会话在数秒内超时(使用pyspark)

、、、、

我正在尝试对pyspark数据帧执行一些操作。如果数据帧很小，我使用的代码可以很好地对上面的数据帧进行进一步的操作，例如，它可以很好地处理以下形状的数据帧：但是如果我增加数据帧的大小，例如： (21

浏览 0提问于2019-03-29得票数 4

1回答

如何使用R对仅共享某些公共元素的两个矩阵或数据帧求和？

、、、

我有两个很大的数据框，我想要对它们执行元素级操作。在我的例子中，我希望对列名和行名部分重叠的两个矩阵进行矩阵相加。="") a br2 1 1 b cr3 10 10>Sr</em

浏览 0提问于2017-06-06得票数 0

3回答

R:为每列设置值的数量来筛选行

、、、

我有一个非常大的数据帧，其中包含2个重要的列，它们具有感兴趣的值，目前用逗号分隔。例如： ID Data1 Data22 3, 4 4 8035, 40, 30 5 50, 15 90 "12，5，6“在R中读作一个字符。我需要对数据进行子集

浏览 37提问于2021-07-12得票数 0

1回答

R:如何基于回归模型(glmm)对数据进行子集

、、、

使用的许多变量都有丢失的数据(我已经使用估算或其他方法(在适当情况下仍然有相当多的方法)来解释丢失的数据)，因此很明显，由于列表删除，许多行被排除在原始数据框架之外。我现在需要做一些描述性的统计工作(主要是由于许多变量是序数/标称的频率)。是否有一种简单的方法来对原始数据框架进行<

浏览 0提问于2019-06-19得票数 0

回答已采纳

2回答

在转换后从列表中提取单独的数据帧(lapply)？

我正在学习R，并且正在寻找一种方法来在多个数据帧之间进行相同的数据转换，例如，重新编码每个数据帧中出现的变量，而不必每次都为每个数据帧键入代码。我创建了一个数据帧列表，然后使用lapply()在一个函数中对它们进行转换，但是结果被存储<em

浏览 0提问于2016-12-09得票数 0

1回答

通过响应频率减少交叉表大小

请原谅我的新手问题--我是R的新手，对统计学很不了解。我有一个简单的联想表，表示在一段时间内每个用户对一组网页的查询次数。总共大约有15,000个观察值。由于50x100矩阵很难可视化，因此我想给出这个表的一个子集，它按最大的聚合排序--列(页组)、行(用户)，甚至可能是最大的逐列计数。例如，我可能选择前20个用户和前10个组，或者选择前99%

浏览 2提问于2012-03-02得票数 1

1回答

在循环中调用不同的数据名称

下面是我如何为初始dim(数据)<-500(行)17(列)矩阵创建多个名称为data_1、data_2、data_3 .....and等的数据集的方法 assign(paste("data", i, sep = "_"),subset(data[data$cluster == i,]))到目前为止，一切都很好for

浏览 1提问于2017-03-02得票数 1

回答已采纳

4回答

如何使列由几行组成？

、、

我对R和编程本身非常陌生，现在我的data.frame有一个问题，它不允许我继续我的工作。和Clare )，我有他们在3个不同场合(2009,2010,2011)提出的测试中的分数。请让我知道是否有办法实际结束于表2而不是表1，因为我有超过10000个观察结果，而表1的设置不会让我继续进行预期的提议。编辑：数据帧如下所示

浏览 6提问于2013-01-23得票数 3

回答已采纳

3回答

dplyr中的filter()如何计算自定义函数中的()中的内容？

、、、、

我正在尝试编写一个函数，该函数接受两个列名以及每个列名的上界和/或下界，这样我就可以用我选择的列名和边界来子集数据。以mtcar为例，如果我想通过说我只需要具有cyl > 4和mpg > 15的行来设置数据子集，在这种情况下，我的函数将接受两个列名cyl和mpg，每个列名也有两个下限，分别为4和15。当然，在函数中，我可以选择为其分配一个上限，以将列名(变量)保持在一定范围内。

浏览 14提问于2019-11-09得票数 0

1回答

对大数据帧进行赋值

、、

在R中，我用以下方式创建了一个数据框：data$number = 0当我运行一个为数据框赋值的为什么它在R中这么慢？我记得读过R逐列存储矩阵(例如，与C不同，它是逐行存储的)。但是，我仍然不明白为什么要花这么多时间。我的data.frame不应该舒适地放在内存中(避

浏览 0提问于2013-05-24得票数 0

1回答

如何理解哪些内容可以放在花括号内或外面？

作为R的初学者，我一直在努力阅读复杂的代码(至少对我来说，这是复杂的)。当我阅读简单的代码时，结构非常清晰。我能分辨出哪些是参数，哪些是变量，还有其他类似的东西。例如：for (i in seq_along(df)) { }我不知道为什

浏览 2提问于2020-04-04得票数 0

回答已采纳

1回答

使用Mapply将函数的结果作为数据框行返回

我有一个相当大的R数据框架。我希望使用mapply从几列中获取输入，并将它们逐行传递给一个函数，从该函数返回的将是一个5位数字向量，我希望再次以逐行为基础将其分配给原始数据框中的10列。但另外，我希望能够在行的子集上执行此操作。]<-mapply(my.function, my.df$a, my.df$b, my.df$c) 然而，如果我想在数据帧的一个大的

浏览 0提问于2016-12-22得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在base R中有没有一种快速的方法来根据操作相关器对数据帧进行子集？(例如MPG >20)

相关·内容

在base R中有没有一种快速的方法来根据操作相关器对数据帧进行子集？(例如MPG >20)

在R中映射2个不相关的数据帧

R dplyr对只知道其字符串名称的列进行操作。

从符合特定条件的数据框中提取所有行

pandas使用自定义函数按索引对行进行排序

非常大的制表符分隔的文本文件的列选择

R:在数据帧的子集上快速执行操作，然后在没有内部函数的情况下重新聚合结果。

故障减法r数据帧

大型数据帧( pyspark)上的EMR笔记本会话在数秒内超时(使用pyspark)

如何使用R对仅共享某些公共元素的两个矩阵或数据帧求和？

R:为每列设置值的数量来筛选行

R:如何基于回归模型(glmm)对数据进行子集

在转换后从列表中提取单独的数据帧(lapply)？

通过响应频率减少交叉表大小

在循环中调用不同的数据名称

如何使列由几行组成？

dplyr中的filter()如何计算自定义函数中的()中的内容？

对大数据帧进行赋值

如何理解哪些内容可以放在花括号内或外面？

使用Mapply将函数的结果作为数据框行返回

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐