R dataframe使用跨/ all_of / mutate_if从现有列创建多个新列

R dataframe使用跨/ all_of / mutate_if从现有列创建多个新列。

在R语言中，可以使用dplyr包中的mutate()函数和tidyselect包中的across()、all_of()和mutate_if()函数来从现有列创建多个新列。

跨(across)函数：跨函数用于选择多个列，并对这些列应用相同的操作。它接受一个或多个列名或选择器，并返回一个可以在mutate()函数中使用的选择器。例如，如果我们有一个名为df的数据框，其中包含列A、B和C，我们可以使用跨函数将这些列相加并创建一个新列D：

library(dplyr)

df <- df %>%
  mutate(across(c(A, B, C), ~ .x + 1, .names = "D_{.col}"))

上述代码将对列A、B和C中的每个元素加1，并将结果存储在新创建的列D_A、D_B和D_C中。

all_of()函数： all_of()函数用于在mutate()函数中引用一个或多个列名。它接受一个或多个列名，并返回一个可以在mutate()函数中使用的选择器。例如，如果我们有一个名为df的数据框，其中包含列A、B和C，我们可以使用all_of()函数将这些列相加并创建一个新列D：

library(dplyr)

df <- df %>%
  mutate(D = A + B + C)

上述代码将对列A、B和C中的每个元素相加，并将结果存储在新创建的列D中。

mutate_if()函数： mutate_if()函数用于根据条件选择特定类型的列，并对这些列应用相同的操作。它接受一个谓词函数和一个操作函数，并返回一个可以在mutate()函数中使用的选择器。例如，如果我们有一个名为df的数据框，其中包含数值型列和字符型列，我们可以使用mutate_if()函数将数值型列中的元素加1，并将结果存储在新创建的列中：

library(dplyr)

df <- df %>%
  mutate_if(is.numeric, ~ . + 1)

上述代码将对所有数值型列中的每个元素加1，并将结果存储在相应的新创建列中。

总结：使用跨/ all_of / mutate_if函数可以方便地从现有列创建多个新列。跨函数用于选择多个列并应用相同的操作，all_of函数用于在mutate()函数中引用列名，mutate_if函数用于根据条件选择特定类型的列并应用相同的操作。这些函数可以帮助我们在R中进行数据处理和转换操作。

腾讯云相关产品和产品介绍链接地址：

腾讯云数据仓库 ClickHouse：https://cloud.tencent.com/product/ch
腾讯云弹性MapReduce EMR：https://cloud.tencent.com/product/emr
腾讯云云原生容器引擎 TKE：https://cloud.tencent.com/product/tke
腾讯云云数据库 CDB：https://cloud.tencent.com/product/cdb
腾讯云云服务器 CVM：https://cloud.tencent.com/product/cvm
腾讯云人工智能 AI：https://cloud.tencent.com/product/ai
腾讯云物联网 IoT Hub：https://cloud.tencent.com/product/iothub
腾讯云移动开发 MSDK：https://cloud.tencent.com/product/msdk
腾讯云对象存储 COS：https://cloud.tencent.com/product/cos
腾讯云区块链服务 TBC：https://cloud.tencent.com/product/tbc
腾讯云元宇宙服务 TUS：https://cloud.tencent.com/product/tus

相关·内容

R语言第二章数据处理⑤数据框列的转化和计算目录正文

正文本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数： Mutate（）：计算新变量并将其添加到数据表中。它保留了现有的变量。...Transmutate（）：计算新列但删除现有变量。...Mutate_at（）/ transmutate_at（）：将函数应用于使用字符向量选择的特定列 Mutate_if（）/ transmutate_if（）：将函数应用于使用返回TRUE的谓词函数选择的列...mutate：通过保留现有变量来添加新变量，通过保留现有列来添加新列（sepal_by_petal）： library(tidyverse) my_data <- as_tibble(iris) my_data...my_data %>% mutate(sepal_by_petal_l = Sepal.Length/Petal.Length) transmute：通过删除现有变量来创建新变量，删除现有列，添加新列

4.1K2 0

「R」dplyr 列式计算

_if, _at, _all 「dplyr」以前的版本允许以不同的方式将函数应用到多个列：使用带有_if、_at和_all后缀的函数。这些功能解决了迫切的需求而被许多人使用，但现在被取代了。...这使「dplyr」更容易使用（因为需要记住的函数更少），也使我们更容易实现新的动词（因为我们只需要实现一个函数，而不是四个）。...这是由 base R 提供的，但它并没有很好的文档，我们花了一段时间才发现它是有用的，而不仅仅是理论上的好奇。我们可以使用数据框让汇总函数返回多列。...我们可以使用没有外部名称作为将数据框列解包为单独列的约定。你如何转移已经存在的代码？...它们已经有选择语义，所以通常以与 across() 不同的方式使用，我们需要使用新的 rename_with() 代替。

2.4K1 0

手把手 | 如何用Python做自动化特征工程

特征工程也称为特征创建，是从现有数据构建新特征以训练机器学习模型的过程。这个步骤可能比实际应用的模型更重要，因为机器学习算法只从我们提供的数据中学习，然而创建与任务相关的特征绝对是至关重要的。...转换作用于单个表（从Python角度来看，表只是一个Pandas 数据框），它通过一个或多个现有的列创建新特征。例如，如果我们有如下客户表。...我们使用以下语法将一个现有索引的实体添加到实体集中： # Create an entity from the client dataframe # This dataframe already has...转换：在单个表上对一列或多列执行的操作。一个例子是在一个表中取两个列之间的差异或取一列的绝对值。在featuretools中使用这些基元本身或堆叠多个基元，来创建新功能。...聚合就是将深度特征合成依次将特征基元堆叠，利用了跨表之间的一对多关系，而转换是应用于单个表中的一个或多个列的函数，从多个表构建新特征。

4.3K1 0

python使用pandas的常用操作

重塑数据通常包括将数据从宽格式转换为长格式，或从长格式转换为宽格式。..., 'City': ['木星', '海王星'] } new_df = pd.DataFrame(new_data) # 追加新数据到现有 DataFrame updated_df = pd.concat....xlsx' # 创建新的 DataFrame 以追加 new_data = {'Name': ['百度', 'CSDN主页'], 'URL': ['https://www.baidu.com', '...https://blog.csdn.net/qq_46158060']} new_df = pd.DataFrame(new_data) # 使用 openpyxl 加载现有的工作簿 wb = load_workbook...DataFrame 追加到现有的 Excel 文件 for r in dataframe_to_rows(new_df, index=False, header=last_row == 0):

1141 0

Pandas之实用手册

用read_csv加载这个包含来自音乐流服务的数据的基本 CSV 文件：df = pandas.read_csv('music.csv')现在变量df是 pandas DataFrame：1.2 选择我们可以使用其标签选择任何列...：使用数字选择一行或多行：也可以使用列标签和行号来选择表的任何区域loc：1.3 过滤使用特定值轻松过滤行。...除了 sum()，pandas 还提供了多种聚合函数，包括mean()计算平均值、min()、max()和多个其他函数。1.6 从现有列创建新列通常在数据分析过程中，发现需要从现有列中创建新列。...(dic, orient='index')DataFrame叠加DataFrame"""append two dfs"""df.append(df2, ignore_index=True)叠加很多个DataFrame...)df['A'] """ will bring out a col """ df.ix[0] """will bring out a row, #0 in this case""" 从DataFrame

1371 0

基于Spark的机器学习实践 (二) - 初识MLlib

公告：基于DataFrame的API是主要的API 基于MLlib RDD的API现在处于维护模式。从Spark 2.0开始，spark.mllib包中基于RDD的API已进入维护模式。...DataFrame的许多好处包括Spark数据源，SQL / DataFrame查询，Tungsten和Catalyst优化以及跨语言的统一API。...基于DataFrame的MLlib API跨ML算法和多种语言提供统一的API。 DataFrames有助于实用的ML管道，特别是功能转换。有关详细信息，请参阅管道指南什么是“Spark ML”？...添加了OneHotEncoderEstimator，应该使用它来代替现有的OneHotEncoder转换器。新的估算器支持转换多个列。...SPARK-16957：树算法现在使用中点来分割值。这可能会改变模型训练的结果。 SPARK-14657：修复了RFormula在没有截距的情况下生成的特征与R中的输出不一致的问题。

2.6K2 0

基于Spark的机器学习实践 (二) - 初识MLlib

3.5K4 0

可自动构造机器学习特征的Python库

特征工程也被称为特征构造，是从现有数据中构造新的特征从而训练机器学习模型的过程。...特征工程基本概念特征工程意味着从现有的数据中构造额外特征，这些特征通常分布在多张相关的表中。特征工程需要从数据中提取相关信息并将其存入单张表格中，然后被用来训练机器学习模型。...另一方面，「聚合」是跨表实现的，并使用一对多的关联来对观测值分组，然后计算统计量。...转换：对一张表中一或多列完成的操作。一个例子就是取一张表中两列之间的差值或者取一列的绝对值。在特征工具中单独使用这些基元或者叠加使用这些基元可以构造新的特征。...深度特征合成可以依次叠加特征基元：「聚合」，它们在多张表间的一对多关联中起作用，以及「转换」，是应用于单张表中一或多列以从多张表中构造新的特征的函数。

1.9K3 0

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

使用tempfile() 基础 R 中的函数来创建一个名为 temp. 这是我们将放置压缩文件的地方。 temp <- tempfile() R 创建了一个名为的临时文件 temp 。...还将FF数据转换为十进制，并创建了一个名为R\_excess的新列，保存高于无风险利率的收益。...CAPM 使用简单的线性回归，而 FF 使用具有许多自变量的多元回归。因此，我们的 3 因子 FF 方程为 lm(R_excess ~ MKT_RF + SMB + HML。...ffdlrhd <- ffptoltus %>% do) %>% tidy(conf.level = .95) fdlyd %>% mutate_if %>% select...我们可以将这些结果通过管道传输到 ggplot() 并创建具有置信区间的系数散点图。我不想绘制截距，因此会将其从代码流中过滤掉。我们用errorbar添加置信区间。

3.7K3 0

Pandas中替换值的简单方法

使用内置的 Pandas 方法进行高级数据处理和字符串操作 Pandas 库被广泛用作数据处理和分析工具，用于从数据中清理和提取特征。在处理数据时，编辑或删除某些数据作为预处理步骤的一部分。...这可能涉及从现有列创建新列，或修改现有列以使它们适合更易于使用。为此，Pandas 提供了多种方法，您可以使用这些方法来处理 DataFrame 中所有数据类型的列。...在这篇文章中，让我们具体看看在 DataFrame 中的列中替换值和子字符串。当您想替换列中的每个值或只想编辑值的一部分时，这会派上用场。如果您想继续，请在此处下载数据集并加载下面的代码。...import pandas as pd df = pd.read_csv('WordsByCharacter.csv') 使用“替换”来编辑 Pandas DataFrame 系列（列）中的字符串...每当在列值中找到它时，它就会从字符串中删除，因为我们传递的第二个参数是一个空字符串。

5.4K3 0

Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN

他们描述如何从多个 worker 并行读取数据时将表给分区。partitionColumn 必须是有问题的表中的数字列。...从 1.6.1 开始，在 sparkR 中 withColumn 方法支持添加一个新列或更换 DataFrame 同名的现有列。...PySpark 中 DataFrame 的 withColumn 方法支持添加新的列或替换现有的同名列。...该列将始终在 DateFrame 结果中被加入作为新的列，即使现有的列可能存在相同的名称。...从 1.4 版本开始，DataFrame.withColumn() 支持添加与所有现有列的名称不同的列或替换现有的同名列。

25.9K8 0

数据处理第2节：将列转换为正确的形状

转换列：基础部分您可以使用mutate（）函数创建新列。 mutate中的选项几乎是无穷无尽的：你可以对普通向量做任何事情，可以在mutate（）函数内完成。...在这些情况下，我们必须在给出round（）指令之前添加列需要为数字的条件，这可以使用mutate_if来完成。通过使用mutate_if（），我们在管道中需要两个参数：首先，它需要有关列的信息。...如果我想在几分钟内完成，我可以使用mutate_at（）并将包含列的所有'sleep'包装在vars（）中。其次，我在飞行中创建一个函数，将每个值乘以60。...10.1 long ## 10 Roe deer 3.00 short ## # ... with 73 more rows 创建新的离散列...您指定新列名称，然后指定要合并的列，最后指定要使用的分隔符。

8K3 0

资源 | Feature Tools：可自动构造机器学习特征的Python库

2.1K2 0

Pandas数据结构之DataFrame常见操作

提取、添加、删除列用方法链分配新列索引 / 选择数据对齐和运算转置 DataFrame 应用 NumPy 函数控制台显示 DataFrame 列属性访问和 IPython 代码补全提取、添加...受 dplyr 的 mutate 启发，DataFrame 提供了 assign() 方法，可以利用现有的列创建新列。...从 3.6 版开始，Python 可以保存 **kwargs 顺序。这种操作允许依赖赋值，**kwargs 后的表达式，可以引用同一个 assign() 函数里之前创建的列。...要想编写支持 3.6 之前或之后版本的 Python 代码，传递 assign 表达式时，要注意以下两点：更新现有的列在同一个 assign 引用刚建立的更新列示例如下，更新列 “A”，然后，在创建...重建索引介绍重建索引 / 遵循新标签集的基础知识。数据对齐和运算 DataFrame 对象可以自动对齐列与索引（行标签）的数据。与上文一样，生成的结果是列和行标签的并集。

1.7K2 0

Pandas数据结构之DataFrame常见操作

1.3K4 0

Pandas 2.2 中文官方教程和指南（一）

下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定版本的 Python 和一组库的虚拟环境。从终端窗口运行以下命令。...下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定 Python 版本和一组库的虚拟环境。从终端窗口运行以下命令。...下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定 Python 版本和一组库的虚拟环境。从终端窗口运行以下命令。...如何从现有列派生新列如何计算摘要统计信息如何重新设计表格布局如何合并来自多个表的数据如何轻松处理时间序列数据如何操作文本数据 pandas 处理什么类型的数据...当特别关注表中位置的某些行和/或列时，请在选择括号[]前使用iloc运算符。使用loc或iloc选择特定行和/或列时，可以为所选数据分配新值。

2941 0

Pandas数据结构之DataFrame常见操作

受 dplyr 的 mutate 启发，DataFrame 提供了 assign() 方法，可以利用现有的列创建新列。...从 3.6 版开始，Python 可以保存 **kwargs 顺序。这种操作允许依赖赋值，**kwargs 后的表达式，可以引用同一个 assign() 函数里之前创建的列。...要想编写支持 3.6 之前或之后版本的 Python 代码，传递 assign 表达式时，要注意以下两点：更新现有的列在同一个 assign 引用刚建立的更新列示例如下，更新列 “A”，然后，在创建...x: x["A"] + 2) Python 3.5 或更早版本的表达式在创建 B 列时引用的是 A 列的“旧”值 [1, 1, 1]。...重建索引介绍重建索引 / 遵循新标签集的基础知识。数据对齐和运算 DataFrame 对象可以自动对齐列与索引（行标签）的数据。与上文一样，生成的结果是列和行标签的并集。

1.4K1 0

图解pandas的assign函数

在我们处理数据的时候，有时需要根据某个列进行计算得到一个新列，以便后续使用，相当于是根据已知列得到新的列，这个时候assign函数非常方便。下面通过实例来说明函数的的用法。...如果列名是不可调用的（例如：Series、标量scalar或者数组array），则直接进行分配最后，这个函数的返回值是一个新的DataFrame数据框，包含所有现有列和新生成的列导入库 import...peter 2 18 mike 在Python3.6+中，我们可以在同一个赋值中创建多个列，并且其中一个列还可以依赖于同一个赋值中定义的另一列，也就是中间生成的新列可以直接使用： df.assign...col2 0 12 xiaoming 1 16 peter 2 18 mike 如果我们重新分配的是一个现有的列，那么这个现有列的值将会被覆盖： df.assign(col1=df["col1"]...：BMI 总结通过上面的例子，我们发现：使用assign函数生成的DataFrame是不会改变原来的数据，这个DataFrame是新的 assign函数能够同时操作多个列名，并且中间生成的列名能够直接使用

3542 0

业界使用最多的Python中Dataframe的重塑变形

pivot pivot函数用于从给定的表中创建出新的派生表 pivot有三个参数: 索引列值 def pivot_simple(index, columns, values): """...frame's columns values : ndarray Values to use for populating new frame's values pivot函数将创建一个新表...因此，必须确保我们指定的列和行没有重复的数据，才可以用pivot函数 pivot_table方法实现了类似pivot方法的功能它可以在指定的列和行有重复的情况下使用我们可以使用均值、中值或其他的聚合函数来计算重复条目中的单个值...假设我们有一个在行列上有多个索引的DataFrame。...(col_idx_arr) print "列索引:" print col_idx # 创建DataFrame d = DataFrame(np.arange(6).reshape(2,3), index

1.9K1 0

PySpark SQL——SQL和pd.DataFrame的结合体

1）创建DataFrame的方式主要有两大类：从其他数据类型转换，包括RDD、嵌套list、pd.DataFrame等，主要是通过spark.createDataFrame()接口创建从文件、数据库中读取创建...以及对单列进行简单的运算和变换，具体应用场景可参考pd.DataFrame中赋值新列的用法，例如下述例子中首先通过"*"关键字提取现有的所有列，而后通过df.age+1构造了名字为(age+1)的新列。...（若当前已有则执行修改，否则创建新列），第二个参数则为该列取值，可以是常数也可以是根据已有列进行某种运算得到，返回值是一个调整了相应列后的新DataFrame # 根据age列创建一个名为ageNew的新列...DataFrame基础上增加或修改一列，并返回新的DataFrame（包括原有其他列），适用于仅创建或修改单列；而select准确的讲是筛选新列，仅仅是在筛选过程中可以通过添加运算或表达式实现创建多个新列...，返回一个筛选新列的DataFrame，而且是筛选多少列就返回多少列，适用于同时创建多列的情况（官方文档建议出于性能考虑和防止内存溢出，在创建多列时首选select） show：将DataFrame显示打印

9.9K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R dataframe使用跨/ all_of / mutate_if从现有列创建多个新列

相关·内容

R语言第二章数据处理⑤数据框列的转化和计算目录正文

「R」dplyr 列式计算

手把手 | 如何用Python做自动化特征工程

python使用pandas的常用操作

Pandas之实用手册

基于Spark的机器学习实践 (二) - 初识MLlib

基于Spark的机器学习实践 (二) - 初识MLlib

可自动构造机器学习特征的Python库

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

Pandas中替换值的简单方法

Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN

数据处理第2节：将列转换为正确的形状

资源 | Feature Tools：可自动构造机器学习特征的Python库

Pandas数据结构之DataFrame常见操作

Pandas数据结构之DataFrame常见操作

Pandas 2.2 中文官方教程和指南（一）

Pandas数据结构之DataFrame常见操作

图解pandas的assign函数

业界使用最多的Python中Dataframe的重塑变形

PySpark SQL——SQL和pd.DataFrame的结合体

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐