文章/答案/技术大牛

发布

R当列查找来自不同的data.frame时，将嵌套的for循环替换为dplyr

在R语言中，使用dplyr包可以高效地处理数据框（data.frame）之间的列查找和操作，而不需要使用嵌套的for循环。dplyr提供了许多函数来简化数据操作，例如left_join、right_join、inner_join和full_join等，这些函数可以用来合并两个或多个数据框，基于某些列的值进行匹配。

基础概念

data.frame: R中的基本数据结构，类似于其他编程语言中的表格或数据库表。
dplyr: 一个R包，提供了一系列用于数据操作的函数，旨在使数据操作更加直观和高效。

类型

内连接（inner_join）: 只保留两个数据框中匹配的行。
左连接（left_join）: 保留左边的数据框的所有行，右边的数据框中不匹配的行用NA填充。
右连接（right_join）: 保留右边的数据框的所有行，左边的数据框中不匹配的行用NA填充。
全连接（full_join）: 保留两个数据框中的所有行，不匹配的行用NA填充。

应用场景

数据清洗: 合并来自不同来源的数据框，进行数据清洗和预处理。
数据分析: 在分析过程中合并多个数据集，以便进行更复杂的统计分析。
报告生成: 准备数据以供报告或可视化工具使用。

示例代码

假设我们有两个数据框df1和df2，我们想要基于某一列（比如id）将它们合并：

# 安装并加载dplyr包
install.packages("dplyr")
library(dplyr)

# 示例数据框
df1 <- data.frame(id = c(1, 2, 3), value1 = c("A", "B", "C"))
df2 <- data.frame(id = c(2, 3, 4), value2 = c("X", "Y", "Z"))

# 使用left_join合并数据框
result <- df1 %>%
  left_join(df2, by = "id")

print(result)

遇到的问题及解决方法

如果在合并过程中遇到问题，比如某些行没有匹配项，可以考虑以下几点：

确保用于连接的列在两个数据框中都存在且名称相同。
检查数据框中是否有缺失值或异常值影响匹配。
使用anti_join找出在一个数据框中存在而在另一个数据框中不存在的行，以便进一步调查。

通过使用dplyr包中的函数，可以避免编写复杂的嵌套循环，从而提高代码的效率和可维护性。

页面内容是否对你有帮助？

有帮助

没帮助

R当列查找来自不同的data.frame时，将嵌套的for循环替换为dplyr

、

这个问题的核心涉及当group_by信息来自与被总结的单元不同的data.frame时使用dplyr。示例:我已将位置分配给其他地方的组。该组位置到组的每个唯一分配是一个计划。有成千上万的计划。我正在寻找每个计划的摘要统计数据。我是在一个缓慢的嵌套for循环中做这件事的，我希望尽可能地加速这

浏览 9提问于2020-04-18得票数 2

回答已采纳

5回答

R包dplyr中的头()函数

、

这是一个小问题，但在R中，当您键入head(data.frame)时，您会从显示的所有列中获得前几条记录。在dplyr包中，head函数已被更改为只显示可以在控制台窗口中容纳的列。这通常很好，但我经常希望看到所有列的前几个记录。是否有一种方法可以告诉head (在dplyr中)显示所有列，而不将tbl.df/data.frame转<em

浏览 2提问于2014-05-01得票数 8

回答已采纳

1回答

在dplyr tbl_df中获得删除列的最佳实践

、、

我记得2001年关于r-help的评论说，drop = TRUE in [.data.frame是R历史上最糟糕的设计决策。我目前的解决方案使用unlist，如下所示，以获得1<

浏览 1提问于2015-06-11得票数 9

回答已采纳

1回答

使用dplyr/tidyr选择命名向量的元素

很简单的问题，我不知道因为什么原因。我有一个命名的向量：如何使用dplyr选择Clyde和Frank的数字？dat %>% select(Clyde, Frank) 我确信这是一个超级简单的解决方案，只是找不出答案。谢谢!

浏览 4提问于2019-09-28得票数 1

回答已采纳

1回答

Server选择嵌套循环与维度表连接，并对每一行进行查找

、、、

我面临一个问题，即Server生成一个非最优的执行计划:嵌套循环连接并查找维度表，并在其上执行2M读取。运行完全相同的查询(都来自SSMS)将使用哈希联接和维度表扫描(32K读取)生成不同的计划：我需要帮助来理解和解决这个问题。我可以通过提示Hash Joi

浏览 0提问于2018-09-04得票数 6

回答已采纳

3回答

为什么toString不能在手动创建的data.frame上正常工作？

、、

我有一个手动创建的data.frame，如下所示：> a1 1 13 4 4> toString(a)有人帮忙吗？已经提出并回答了一个类似的问题，因此我们可能可以将这个问题更改为为什么toSt

浏览 2提问于2020-09-18得票数 1

回答已采纳

2回答

R中重复行名的逐行计算

我在R中有一个更大的数据帧，我希望用行名进行一些计算。以下部分显示的数据框架包含236个气象站，每个气象站显示9次，因为每个气象站对每个天气变量都有9个不同的预报小时。事实上，每小时没有列在它自己的列是无关紧要的，因为我想把降雪加起来，平均风和温度。因此，我的最终数据帧将把数据帧连接成236行(每个站一列)，总降雪量、平均风速和平均温度。我尝试过应用程序家族中的许多函数，并在<em

浏览 2提问于2015-01-23得票数 1

回答已采纳

1回答

我想循环它们并使用函数table获得频率计数，然后将这些值放入数据帧中，但我收到了一个subscript out of bounds错误。它这样做是因为它需要一个integer值。当发生这种情况时，我希望将整数值设置为0。是否有一个简单的函数可以环绕integer值，例如返回0的somefunction(t[[6]]) #list of vectors, the first has values 1 to 7, the1,1,2,2,3,3,3,4,4,5,5,5,5,

浏览 5提问于2020-07-12得票数 1

回答已采纳

2回答

R中数据列的动态变异，无法计算如何使用函数或循环

、、

{更多细节-每个数据来自不同的电子表格，我的外地工作人员填写，在ODK中创建，并从服务器导出到一个csv文件，然后导入到一个R数据。这些都会进入dataframe中的不同列，我想用一个ID创建一个新列，而不管ID来自"IDscan“列还是"IDmanual”列}。我希望根据来自其他列的值，在每个数据帧中创建

浏览 1提问于2019-12-28得票数 2

回答已采纳

2回答

dplyr：：选择等效设置字符向量

、

有没有人知道是否有相当于dplyr::select()的字符向量？具体来说，我喜欢dplyr::select()的一点是选择dataframe列是多么容易；您可以输入列的名称(带或不带引号)，并类似地从这些名称创建范围。", 1:5),是否有用户可以输入：someFunction(char_vec, Include1:Include5)以获得结果的函数？我意识到有许多与正则表达式相关的解决方案

浏览 6提问于2022-11-20得票数 2

2回答

按变量分组并合并来自另一列的行数据

、、、、

我希望将数据按一列分组，并将不同列中的字符串粘贴到一行中。例如，假设我有一个data.frame AA <- data.frame(student = rep(c("John Smith", "Jane Smith"), 3),A转换为data.frame B，按student变量分组，并将来自variable1的

浏览 3提问于2015-12-30得票数 0

回答已采纳

1回答

在Panel data中为每一年指定Quintile

、、

嗨，我得到了一个面板数据，其中包含3列：Firm，Year，Income。5)df <- cbind(Firm, Year, Income)我想将所有公司每年的收入分别分配给五分之一，并将其放在一个名为Quint的新列中。

浏览 2提问于2017-01-23得票数 0

1回答

聚合数据-按小组分列

、、

6 11 663 3 4 24我试图将其转化为一个数据框架，以便计算每个变量(a、b和c)的平均值a b c2 3.7 6 41.7它们不一定都是小数点1，但点是一样的。

浏览 2提问于2015-08-30得票数 0

回答已采纳

1回答

在R中将1列拆分为1至3列

、

我有一些餐馆数据，表中有一个列，其中的信息以"/"分隔。检查也可以是多哥的命令，可以用命令的名称来表示。"10" "B" "3" [6,] "6" "Bob Togo" NA NA 其中所有列都用于特定方面的检查，其中NAs用于检查

浏览 4提问于2017-04-15得票数 2

回答已采纳

1回答

拼合嵌套在data.frames中的列表

我遇到很多嵌套在data.frame列中的列表，在可能的情况下，也就是当嵌套的元素可能被强制转换为与父元素具有相同行数的data.frame时，我没有看到任何通用的方法来扁平化这些列表。考虑这些嵌套的例子：data_frame(a=1:3, b = c('a'

浏览 11提问于2017-06-28得票数 6

回答已采纳

5回答

未叠加润滑油的区间类

、、

我正试图通过取消嵌套/取消堆叠的方式，将由一个df ( value-column )、两个日期列(start和end)和一个interval列(duration)组成的数据格式转换为长格式。library(dplyr) df <- data.frame(value = letters[1:3], start = as_date(1:3), end =定义的每天重复的</e

浏览 8提问于2021-05-18得票数 4

回答已采纳

1回答

如何在R中求和多行

尝试对这些数据执行一些基本的操作，只需添加同一时间的所有行。我试过SUM和dcast，但我不确定它是否在做我想做的事情。我想把每一个日期和时间的所有可用的、免费的和总数字加在一起。., sum)这样的东西，但是只有当我将数据更改为在df中有一个可用的、免费的或完全可用的数据时，这才能起作用。

浏览 3提问于2015-08-13得票数 1

回答已采纳

2回答

通过.Rmd编织r假人包怪异的列名

、、

我刚刚注意到，在dummies包R中，当用.Rmd编织时，有一种非常奇怪的行为。这是一个可重复的例子。---author: "Kim"output: toc_depth: '3' ```{r</em

浏览 6提问于2017-12-26得票数 3

回答已采纳

4回答

将不同名称的嵌套列表转换为data.frame，填充NA并添加列

、、、、

我需要一个基本的R解决方案来将不同名称的嵌套列表转换为data.frame mylist <- list(list(a=1,b=2), list(a=3), list(b=5), list(a=9, z::bind_rows或data.table::rbindlist与fill = TRUE (虽然不是理想的，因为它用NULL填充字符列，而不是NA)，但是我确实需要在基R中找到一个解决方案来简化这个问题(do.

浏览 12提问于2022-05-10得票数 2

回答已采纳

1回答

使用数据帧中的列值查找矩阵名和汇总矩阵

、、

我试图在现有的数据框架中添加一个新的列，它显示二进制矩阵中的一个列的数目。现有数据框架中的一列具有矩阵名称，其计数/和是我要查找的。例如,c <- 10MatB <- matrix(sample(0:1,r*c,

浏览 4提问于2017-08-16得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R当列查找来自不同的data.frame时，将嵌套的for循环替换为dplyr

基础概念

相关优势

类型

应用场景

示例代码

遇到的问题及解决方法

相关·内容

R当列查找来自不同的data.frame时，将嵌套的for循环替换为dplyr

R包dplyr中的头()函数

在dplyr tbl_df中获得删除列的最佳实践

使用dplyr/tidyr选择命名向量的元素

Server选择嵌套循环与维度表连接，并对每一行进行查找

为什么toString不能在手动创建的data.frame上正常工作？

R中重复行名的逐行计算

R代表循环向量，如果下标界改变为一定值

R中数据列的动态变异，无法计算如何使用函数或循环

dplyr：：选择等效设置字符向量

按变量分组并合并来自另一列的行数据

在Panel data中为每一年指定Quintile

聚合数据-按小组分列

在R中将1列拆分为1至3列

拼合嵌套在data.frames中的列表

未叠加润滑油的区间类

如何在R中求和多行

通过.Rmd编织r假人包怪异的列名

将不同名称的嵌套列表转换为data.frame，填充NA并添加列

使用数据帧中的列值查找矩阵名和汇总矩阵

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐