如何根据来自另一个tibble的信息添加tibble列

根据来自另一个tibble的信息添加tibble列可以使用dplyr包中的mutate()函数。下面是一个完善且全面的答案：

在R语言中，可以使用dplyr包来操作和处理数据框（tibble）。要根据来自另一个tibble的信息添加列，可以使用mutate()函数。mutate()函数可以在现有的tibble中添加新的列，并根据其他列的值进行计算或转换。

以下是使用mutate()函数根据另一个tibble的信息添加列的步骤：

首先，确保已经安装了dplyr包，并加载它：

install.packages("dplyr")  # 安装dplyr包
library(dplyr)             # 加载dplyr包

然后，创建两个示例tibble，一个是源tibble，另一个是包含要添加的列的tibble。假设源tibble名为tibble1，包含要添加的列的tibble名为tibble2。

# 创建源tibble
tibble1 <- tibble(
  id = c(1, 2, 3),
  name = c("Alice", "Bob", "Charlie")
)

# 创建包含要添加的列的tibble
tibble2 <- tibble(
  id = c(1, 2, 3),
  age = c(25, 30, 35)
)

使用mutate()函数将tibble2中的列添加到tibble1中。可以使用join操作（如left_join()）将两个tibble连接在一起，并使用select()函数选择要添加的列。

# 使用mutate()函数将tibble2中的列添加到tibble1中
tibble1 <- tibble1 %>%
  left_join(tibble2, by = "id") %>%
  select(id, name, age)

在上述代码中，使用left_join()函数将tibble1和tibble2连接在一起，连接键是"id"列。然后使用select()函数选择"id"、"name"和"age"列，以确保只保留需要的列。

最后，tibble1将包含来自tibble2的新列。可以通过打印tibble1来查看结果。

这是一个完善且全面的答案，涵盖了如何使用dplyr包中的mutate()函数根据另一个tibble的信息添加列的步骤。请注意，这里没有提及任何特定的云计算品牌商，以保持答案的客观性。

相关·内容

数据处理第2节：将列转换为正确的形状

在这些情况下，我们必须在给出round（）指令之前添加列需要为数字的条件，这可以使用mutate_if来完成。通过使用mutate_if（），我们在管道中需要两个参数：首先，它需要有关列的信息。...通过使用mutate_at（），我们在管道中需要两个参数：首先，它需要有关列的信息。...两个选项之间的主要区别是：funs（）版本是一行代码少，但是将添加而不是替换列。根据您的情况，两者都可能有用。...extinct (informal) ## 11 PEW: Probably extinct in the wild (informal) ---- 从其他数据表中引入列如果要添加另一个数据框的信息...连接本身就是一个章节，但在这种特殊情况下你会做一个left_join（），即保持我的主表（在左边），并从另一个向右添加列。在by =语句中，您指定哪些列相同，因此连接知道要添加的位置。

8.1K3 0

R语言第二章数据处理⑦dplyr包（2）列处理目录列名

根据预先确定的列名选择列还有另一个选项可以避免连续重新输入列名：one_of（）。您可以预先设置列名，然后在select（）语句中通过将它们包装在one_of（）中或使用!!运算符来引用它们。...如果你必须添加任何否定或参数，你必须将你的函数包装在funs（）中，或者在重新创建函数之前添加波形符。 msleep %>% select_if(~!...按逻辑表达式选择列实际上，select_if允许您根据任何逻辑函数进行选择，而不仅仅基于数据类型。例如，可以选择平均值大于500的所有列。...n_distinct（），它计算可以在列中找到的不同值的数量。...如果你只是想将几列移到前面，你可以在之后使用everything（）这将简便地添加所有剩余的列。

1.8K4 0

数据处理第3部分：选择行的基本和高级的方法

在这篇文章中，我们将介绍如何挑选您的数据。除了filter的基础知识外，它还介绍了一些更好的方法，用near（）和between（）挑选数字列，或用正则表达式过滤字符串列。...你可以添加一个特定的数字：filter（near（sleep_total，17，tol = 0.5））例如将返回sleep_total在16.5和17.5之间的任何行，或者你可以添加一个公式。...： *filter_all（）将根据您的进一步说明过滤所有列 *filter_if（）需要一个返回布尔值的函数来指示要过滤的列。...msleep数据集有一组睡眠和体重测量，其中一些数据丢失 - 我无法在那里添加数据。但是前几组专栏只包含动物信息。...Vesper Mouse的遗体缺失，但这是我仍然可以挖掘并添加到数据框的信息，如果我想要的话。所以想象一下，我想找出前几列中我们NA的所有数据行。

1.3K1 0

「R」dplyr 行式计算

「原文来自：dplyr 文档」上一篇：「R」dplyr 列式计算通常 dplyr 和 R 更适合对列进行操作，而对行操作则显得更麻烦。...，它仅改变其他动词操作如何工作。...，我们县创建一个行式数据框： rf % rowwise(id) 我们然后使用 mutate() 添加一个新的列，或者使用 summarise() 仅返回一个汇总列： rf %>% mutate...既然已经到了这里，你可能已经猜到了答案：这只是行模式的另一个应用。...因为输入tibble中的列没有那么规则，所以这种方法更不适合这种方法。

6.2K2 0

盘一盘Tidyverse| 筛行选列之select，玩转列操作

本文根据 msleep数据集，盘一盘“列”的操作。...变量），而生信中的临床信息，实验室检验指标经常上百，基因（突变，表达）信息更是成千上万。...添加顺序即为输出顺序。...2.3 根据部分列名称选择列如果列名结构相似，可使用starts_with()，ends_with()， contains()完成部分匹配。...2）创建函数替换如果输入文件的列名较混乱，根据需求逐步替换。

1.3K2 0

R数据科学|第九章内容介绍

处理关系数据有三类操作：合并连接：向数据框中加入新变量，新变量的值是另一个数据框中的匹配观测。筛选连接：根据是否匹配另一个数据框中的观测，筛选数据框中的观测。...nycflights13 中包含了与 flights 相关的 4 个 tibble：数据表信息 airlines 可以根据航空公司的缩写码查到公司全名。...airports 给出了每个机场的信息，通过 faa 机场编码进行标识。 planes 给出了每架飞机的信息，通过 tailnum 进行标识。 weather 给出了纽约机场每小时的天气状况。...下面借助图形来帮助理解连接的原理： ? 有颜色的列表示作为“键”的变量：它们用于在表间匹配行。灰色列表示“值”列，是与键对应的值。...它有3种连接类型，这些连接会向每个表中添加额外的“虚拟”观测，这个观测的值用NA来填充。

1.6K3 0

数据处理第一节：选取列的基本到高级方法选取列列名

在某些情况下，我添加了一个glimpse（）语句，允许您查看输出tibble中选择的列，而不必每次都打印所有数据。.... ---- 选取列选取列：基础部分如果目的是选择其中几列，只需在select语句中添加列的名称即可。添加它们的顺序将决定它们在output中的显示顺序。...甚至可以取消选择整个chunks列，然后重新添加其中某列。下面的示例代码取消选择从name到awake的所有列，但重新添加列'conservation'，即使它是取消选择的列的一部分。...根据列名特点选择列如果你有很多具有类似列名的列，你可以通过在select语句中添加starts_with（），ends_with（）或contains（）来使用匹配。...根据预先确定的列名选择列还有另一个选项可以避免连续重新输入列名：one_of（）。您可以预先设置列名，然后在select（）语句中通过将它们包装在one_of（）中或使用!!运算符来引用它们。

3K2 0

「R」数据操作（五）：dplyr 介绍与数据过滤

该部分学习内容来自《R for Data Science》。在对数据进行可视化之前我们往往需要进行数据转换以得到可视化所需要的数据内容与格式。...这里我们使用dplyr包操作2013年纽约市的航班起飞数据集（2013）。准备这部分我们聚焦于如何使用dplyr包，除ggplot2的另一个tidyverse核心成员。...，这里适配地显示了在一个屏幕前几行和所有的列（我们可以使用View(flights）在Rstudio中查看数据集的所有信息。...根据值选择观察（记录），filter() 对行重新排序，arrange() 根据名字选择变量，select() 根据已知的变量创建新的变量，mutate() 将许多值塌缩为单个描述性汇总，summarize...另一个你在使用==时可能遭遇的常见问题是浮点数。

2.6K1 1

R数据科学整洁之道：使用 tibble 实现简单数据框

创建 tibble 的另一种方法是使用 tribble() 函数，tribble 是 transposed tibble（转置 tibble）的缩写。...tribble() 是定制化的，可以对数据按行进行编码：列标题由公式（以 ~ 开头）定义，数据条目以逗号分隔，这样就可以用易读的方式对少量数据进行布局： tribble( ~x, ~y, ~z,...打印 tibble 的打印方法进行了优化，只显示前 10 行结果，并且列也是适合屏幕的，这种方式非常适合大数据集。...，如果想要访问的列不存在，它会生成一条警告信息。...tibble 不能进行部分匹配，如果想要访问的列不存在，它会生成一条警告信息。 tibble 打印时更美观。

1.9K1 0

「R」使用gt包创建表格入门

我们使用dplyr根据它准备一个tibble： # 获取世界10个最大的大陆 islands_tbl <- dplyr::tibble( name = names(islands),...给简单的表格加点料 gt包可以通过添加要素来让结果的gt Table更好地表达你所要展示的信息。...# 在列标签上方添加头部信息 gt_tbl <- gt_tbl %>% tab_header( title = "Large Landmasses of the World",...针对行，我们可以使用以列名为变量的条件语句（例如size > 15000）。这里有一个如何添加脚注的简单例子。...至于如何自定义组名的设定和选择，不妨发挥你们得想象力列标签类似于行组，使用tab_spanner()可以将多个列划分为不同的组。

4.7K2 1

「R」数据操作（七）：dplyr 操作变量与汇总

使用mutate()添加新变量除了选择已存在的列，另一个常见的操作是添加新的列。这就是mutate()函数的工作了。 mutate()函数通常将新增变量放在数据集的最后面。...算术操作符算术操作符本质都是向量化的函数，遵循“循环补齐”的规则。如果一个参数比另一个参数短，它会自动扩展为后者同样的长度。比如air_time / 60，hours * 60等等。...例如，让我们看下有最高平均延时的飞机（根据尾号识别）： delays % group_by(tailnum) %>% summarize(...绘制平均延时下航班数目的散点图可以呈现更多的信息： delays % group_by(tailnum) %>% summarize(...让我们看另一个例子：棒球运动中击球手的平均表现与上场击球次数的关系。这里我们使用来自Lahman包的数据计算每个选手平均成功率（击球平均得分数，击球数/尝试数）。

2.6K2 0

「R」dplyr 列式计算

原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多列执行相同的函数操作经常有用...(a:d, mean)) 我们将从讨论 across() 的基本用法开始，特别是将其应用于 summarise() 中和展示如何联合多个函数使用它。...最后我们将简要介绍一下历史，说明为什么我们更喜欢 across() 而不是后一种方法（即 _if(), _at(), _all() 变体函数）以及如何将你的旧代码转换为新的语法实现。...但是 across() 的开发工作离不开以下三个最新发现：你可以有一个数据框的列，它本身就是一个数据框。...我们可以使用没有外部名称作为将数据框列解包为单独列的约定。你如何转移已经存在的代码？

2.4K1 0

tidyverse：R语言中相当于python中pandas+matplotlib的存在

02 — tibble：高级数据框（data.frame升级版） ——数据（列）类型一目了然 tibble是R语言中一个用来替换data.frame类型的扩展的数据框，tibble继承了data.frame...tibble对data.frame做了重新的设定： tibble，不关心输入类型，可存储任意类型，包括list类型 tibble，没有行名设置 row.names tibble，支持任意的列名 tibble...，会自动添加列名 tibble，类型只能回收长度为1的输入 tibble，会懒加载参数，并按顺序运行 tibble，是tbl_df类型 tibble是data.frame的进化版，有如下优点：生成的数据框数据每列可以保持原来的数据格式...对数据框调用其它函数进行汇总操作 summarise(mtcars_df,mdisp = mean(disp, na.rm = TRUE)) 4.6 分组: group_by() #当对数据集通过group_by()添加了分组信息后...#key：将原数据框中的所有列赋给一个新变量key #value：将原数据框中的所有值赋给一个新变量value #…：可以指定哪些列聚到同一列中 #na.rm：是否删除缺失值 widedata <-

4.2K1 0

R海拾遗-tidyverse

3.6 1.4 0.2 setosa ## 6 5.4 3.9 1.7 0.4 setosa # 根据名字选取列...## Levels: setosa versicolor virginica # select # 根据行号 my_data %>% select(1:3)%>% head() ## # A tibble...# 去掉没用的 my_data2 % select(-Species) # 对所有的列进行筛选 my_data2 %>% filter_all(all_vars(.> 2.4...5.9 2.1 virginica ## 6 5.5 2.5 4 1.3 versicolor # 按照特定的列...## 6 5.4 3.9 1.7 0.4 setosa 3.18 # 使用transmute 会删除原来的列

1.2K1 0

将html_table2结果转化为tibble的最佳实践

本文将分享如何高效地将 html_table2 的结果转化为更适合分析的 tibble 格式，并展示一个以采集汽车之家（https://www.autohome.com.cn/）汽车品牌和价格信息为例的完整实践...通过结合这两者，我们可以在数据采集后，直接进入高效的分析流程。2. 转化为 tibble 的原因可读性：tibble 显示时更加紧凑易读。...兼容性：许多 tidyverse 包对 tibble 的支持更佳。操作性：tibble 提供了更强的列操作功能。3....爬取目标页面以汽车之家为例，假设我们需要采集汽车品牌和价格信息。...总结通过本文，我们学习了如何使用 html_table2 提取 HTML 表格，并高效地将其转化为 tibble 以便于后续分析。同时，我们结合代理 IP 技术实现了对汽车之家数据的采集。

831 0

R数据科学|第七章内容介绍

本文将介绍tidyverse的核心R包之一——tibble包创建tibble 使用as_tibble()函数直接将数据转换成tibble形式。...通过tibble()函数使用一个向量来创建新 tibble。tibble() 会自动重复长度为 1 的输入，并可以使用刚刚创建的新变量。...` `2000` #> #> 1 smile space number 使用tribble()函数：tribble() 是定制化的，可以对数据按行进行编码：列标题由公式...> #> 1 a 2 3.6 #> 2 b 1 8.5 对比tibble与data.frame 使用方法 tibble data.frame 打印 tibble只显示前 10 行结果，并且列也是适合屏幕的...取子集提取方式相同，但tibble 更严格：它不能进行部分匹配，如果想要访问的列不存在，它会生成一条警告信息。 [[ 可以按名称或位置提取变量；$ 只能按名称提取变量。

1.1K3 0

使用dplyr进行数据分析：入门篇

我根据R数据科学和tidyverse官网的教程，整理了几篇笔记，主要是对tidyverse的各种函数的用法进行详细的演示。...安装数据集：starwars 针对单个数据集的操作 filter()根据条件筛选行 arrange()进行排序 slice()根据位置选择行 select()选择列 mutate()新建列 relocate...根据某一列进行排序。...直接根据列名选择列，列名不需要使用引号： starwars %>% select(hair_color, skin_color, eye_color) ## # A tibble: 87 x 3 ##...欢迎在评论区留言或直接添加我的微信！

1.5K2 1

dplyr中的行操作

在tidyverse中，整洁数据一般都是每一行是一个观测，每一列是一个变量，基本上所有操作都是基于整洁的数据进行的，都是对某列做什么操作。...但有时候我们也需要对某行做一些操作，dplyr中现在提供了rowwise()函数快速执行对行的操作。...），不使用rowwise()函数，得到的结果是所有数据的均值，很明显不是想要的： df %>% mutate(m = mean(c(x, y, z))) ## # A tibble: 2 × 4 ##...: 2 × 1 ## m ## ## 1 3 ## 2 4 根据name这一列按照行计算均值： df %>% rowwise(name) %>% #...，那就是c_across，帮助你快速选择多列数据： rf %>% mutate(total = sum(c_across(w:z))) ## # A tibble: 6 × 6 ## # Rowwise

1.3K3 0

「R」使用gt包创建表格

我们使用dplyr根据它准备一个tibble： # 获取世界10个最大的大陆 islands_tbl <- dplyr::tibble( name = names(islands),...给简单的表格加点料 gt包可以通过添加要素来让结果的gt Table更好地表达你所要展示的信息。...# 在列标签上方添加头部信息 gt_tbl <- gt_tbl %>% tab_header( title = "Large Landmasses of the World",...针对行，我们可以使用以列名为变量的条件语句（例如size > 15000）。这里有一个如何添加脚注的简单例子。...另外，我们可以用另一个包含列名为rowname的数据集作为gt生成根部分的内容。

2.8K1 0

R语言之 dplyr 包

该数据集来自一项关于新生儿低体重危险因素的病例对照研究。首先加载该数据集并查看其相关信息。 library(dplyr) data(birthwt, package = "MASS") # ??...使用 select( ) 选择列函数 select( ) 用于选择数据框中的列（变量）。 # 下面的命令选择数据框里面的 bwt、age、race 和 smoke 这 4 个变量组成新的数据框。...4.使用 mutate( ) 添加新变量函数 mutate( ) 用于在数据框中创建新的变量。...另外，它没有显示 Groups 属性信息，实际应为 # Groups: race [3]。 tibble 是 tidyverse 系列包（包括 dplyr 包）提供的一种类似数据框的格式。...项目实战 epiDisplay 包里的数据集 Planning 来自 20 世纪 80 年代中期泰国的一项计划生育调查研究，请通过其帮助文件查看数据信息并整理该数据集。

4502 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云