在列表/ dplyr / mutate / List / Rstudio内的datafame上修改新列

基础概念

在R语言中，dplyr是一个非常流行的数据操作包，它提供了一系列简洁且高效的数据处理函数。mutate()函数是dplyr包中的一个核心函数，用于在数据框（dataframe）中创建或修改列。

类型与应用场景

mutate()函数主要用于以下几种类型的数据操作：

创建新列：基于现有列的值计算新列。
修改现有列：直接修改数据框中的某一列。
条件赋值：根据某些条件对新列或现有列进行赋值。

应用场景包括但不限于：

数据清洗：处理缺失值、异常值等。
数据转换：将某一列的数据类型转换为另一种类型。
数据计算：基于现有数据计算新的统计量或指标。

示例代码

假设我们有一个包含学生信息的数据框df，如下所示：

library(dplyr)

# 创建示例数据框
df <- data.frame(
  Name = c("Alice", "Bob", "Charlie"),
  Age = c(20, 22, 21),
  Score = c(85, 90, 78)
)

我们可以使用mutate()函数来添加一个新列Grade，该列基于Score列的值进行计算：

# 使用mutate()添加新列Grade
df <- df %>%
  mutate(
    Grade = case_when(
      Score >= 90 ~ "A",
      Score >= 80 ~ "B",
      Score >= 70 ~ "C",
      TRUE ~ "D"
    )
  )

# 查看修改后的数据框
print(df)

输出结果：

      Name Age Score Grade
1    Alice  20    85     B
2      Bob  22    90     A
3 Charlie  21    78     C

常见问题及解决方法

错误：object 'df' not found
这通常是因为在调用mutate()函数之前没有正确加载dplyr包或没有正确定义数据框df。
这通常是因为在调用mutate()函数之前没有正确加载dplyr包或没有正确定义数据框df。
错误：列名冲突
如果新列的名称与现有列的名称相同，mutate()函数会报错。可以通过为新列指定不同的名称来解决这个问题。
如果新列的名称与现有列的名称相同，mutate()函数会报错。可以通过为新列指定不同的名称来解决这个问题。
性能问题
对于非常大的数据框，mutate()函数可能会比较慢。可以考虑使用data.table包来提高性能。
对于非常大的数据框，mutate()函数可能会比较慢。可以考虑使用data.table包来提高性能。

参考链接

通过以上内容，你应该能够理解如何在R语言中使用dplyr包的mutate()函数来修改数据框中的列，并解决一些常见问题。

相关·内容

Day3-学习R包

这里选择的是中国清华大学的镜像服务器，这样做的好处是在国内下载R包时速度会更快。...同样，这里选择的也是清华大学的镜像服务器。 install.packages("dplyr")：这行代码用于安装名为 dplyr 的R包。.../Local/R/win-library/4.4’ 2.熟悉dplyr五个基础函数 mutate() 函数是 dplyr 包提供的一个用于修改数据框（data frame）的函数，它可以创建新的列或者修改现有的列...中，创建一个名为 new 的新列，该列的每个值是对应行中 Sepal.Length 和 Sepal.Width 的乘积 select(test,1) ##从数据框 test 中选择第一列。...select() 函数是 dplyr 包提供的一个用于选择数据框（data frame）中特定列的函数。

1421 0

生信代码：数据处理（ tidyverse包）

大家在学习R语言的时候，大多参考《R语言实战》这本书，但这本书年代过于久远（中文第二版是2016年），主要着力点也是在R base上，R语言可视化的ggplot2包也只是简要介绍，而对于tidyverse...在Rstudio中加载tidyverse包，可以看到该包下有8个子包，著名的ggplot2包即是其中的一个子集，我们先着重讲一下数据处理有关的包——dplyr包。...dplyr包下主要是以下几个操作: select()——选择列 filter/slice()——筛选行 arrange()——对行进行排序 mutate()——修改列/创建列 summarize(...1 mutate() mutate（）与基础函数transform（）相似，都可以添加新的一列，但是允许引用刚刚创建的列： mydata % mutate(sumx=x1+x2, meanx=sumx/4)##dplyr允许使用管道%>%操作，且meanx可以引用sumx 2

2.1K1 0

从头学R语言——DAY 3

学习资源来自生信星球R包R包直接在Rstudio页面下载的3大来源：官网CRAN、Biocductor、github设置镜像CRAN的镜像网站可以直接在tools-global options（或快捷键...包dplyr作为tidyverse中的核心包之一，主要用于数据转换。...此处先掌握dplyr的5个基本函数：mutate()，select()，filter()，arrange()，summaries()；1个重要的管道工具%>%#用dplyr包进行数据转换#5个核心函数test...mutate()，新增列mutate(test, new = Sepal.Length * Sepal.Width)#select(),提取列...运行报错，要求test为list，但此处test是data.frame#关联数据，合并数据框#内连接，取交集inner_join(test1, test2, by = "x")#左连接，完善左数据left_join

841 0

两个神奇的R包介绍，外加实用小抄

expand（列出每列值所有可能的组合，天哪我是写到这里的时候刚看懂的！）来看示例 ? ? 我是看到了结果才知道我干了啥的喂。就是选中的列中的值各种组合，成为一个新表。...准备工作：准备好Rstudio 安装tydir：install.packages("dplyr") 加载tydir：library（dplyr）一、测试数据 1.新建数据框 frame1Dplyr能实现的小动作 1.arrange 排序按某一/两列值的大小，按照升/降对行排序。...Sampleid select(frame3,contains("n")) #列名包含n的列 select(frame3,starts_with("a")) #以a开头的列 5.mutate 根据原有的列生成新的列...这是根据相同的列名进行合并，当在两个表格中列名不一样时，需要在括号内加 by=c("col1"="col2") 其中col1和2分别是在两个表格中的需合并的列名 semi_join，anti_join

2.5K4 0

R语言学习--R for Data Science（一）

需要的软件 R和RStudio，这本书内容都是在RStudio软件中完成的，RStudio很适合初学者使用，毕竟是专门针对R开发的IDE，界面简洁明了，功能很多，操作也比较人性化，有很多好用的快捷键。...=&q-url-param-list=&q-signature=8ea806a2403e0818c3ebbad8fee827d6b1132c40] Rstudio界面在这里简要介绍下Rstudio的界面...对象和函数顺便简单介绍下对象和函数，在Rstudio中，我们导入的数据或是自己创建的数据都是以对象的形式显示在环境窗口（储存在了内存里），如我创建了对象a和b，它们的值分别是1和2；函数是具有一定功能的对象...，dplyr::mutate()这种输入方式可以表明mutate()函数是来自于dplyr包中的，而且当dplyr中的mutate()函数被其他R包的同名函数屏蔽时，可以用这种方式调用。...在rstudio环境下输入函数或者对象时，可以多按Tab键，用来补齐函数或对象名，提高输入效率。

1.9K0 0

生信星球Day4 学习R包

查看使用bioconductor的默认镜像R最重要的两个配置文件: 一是.Renviron，能够设置R的环境变量；二是.Rprofile，如果启动时找到这个文件，那么就替我们先运行一遍（这个过程就是在启动...Rstudio时完成的）首先，编辑文件file.edit('~/.Rprofile')options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn...(dplyr)dplyr五个基础函数mutate() 新增列，(x，列名=相关数据)select() 筛选列，（x，列号或列名）filter() 筛选行，（x，列名==想要的行）需要逻辑判断arrange...unique值，即统计同类项连接两个表的不同方式inner_join() 內连，取交集，by="x"基于x的列left_join() 左连，保留前一个表，以此多舍少补后一个表full_join()...全连semi_join(x= ,y= ,by="某列") 半连接，返回能够与y表匹配的x表所有记录anti_join(x= ,y= ,by="某列") 反连接，返回无法与y表匹配的x表所有记录简单合并

2114 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

这些变量应该是真正的属性，而不是同一属性在不同年、月等时间的值分别放到单独的列。...在 dplyr 包的 rename() 中用 “新名字 = 旧名字” 格式修改变量名，如： d2.class % dplyr::rename(h=height, w=weight...2.8 mutate 可以为数据框计算新变量，返回含有新变量以及原变量的新数据框： mutate(test, new = Sepal.Length * Sepal.Width) > head(test,...使用统计相关参数计算列表内相关内容。如sum, mean, median, min, max。...实际上，tibble 允许存在数据类型是列表 (list) 的列，子数据框就是以列表数据类型保存在 tibble 的一列中的。

10.9K3 0

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多列执行相同的函数操作经常有用...这使「dplyr」更容易使用（因为需要记住的函数更少），也使我们更容易实现新的动词（因为我们只需要实现一个函数，而不是四个）。...这是由 base R 提供的，但它并没有很好的文档，我们花了一段时间才发现它是有用的，而不仅仅是理论上的好奇。我们可以使用数据框让汇总函数返回多列。...」的开发者们通过 across() 简化了「dplyr」对于一些数据复杂操作的处理逻辑，提高了整体的学习和使用效率，让我们使用者更关注于逻辑而非实现上。

2.4K1 0

R语言快速入门主线知识点分享|文末有资源

列表 list(x,df) ## 3、读存数据（read、save） # 3.1设置工作目录【很重要】 setwd("E:/") #设置当前工作目录为"E:/" getwd() #读取当前工作空间的工作目录...（文件读取保存路径） read.table() #读取带分隔符的文本/数据文件 read.csv() #读取.csv格式的数据，read.table的一种特定应用 df 修改指定列 transform(airquality, Ozone = -Ozone) # 对原始列进行计算 transform(airquality, new = -Ozone, Temp = (...【修改指定单元格，修改指定列，with 关联修改】 # > x # [,1] [,2] [,3] [,4] # [1,] 100 2 3 4 # [2,] 5 6...包的下述五个函数用法 filter # 筛选: arrange # 排列: select # 选择: mutate # 变形: summarise # 汇总: group_by #分组:

8292 0

生信学习小组Day6笔记—Chocolate Ice

安装与加载R包镜像设置目的：加快加载速度方法：应用R的配置文件：Rprofile说起来这个，就必须提到Rstudio最重要的两个配置文件：在刚开始运行Rstudio的时候，程序会查看许多配置内容，其中一个就是....Renviron，它是为了设置R的环境变量（这里先不说它）；而.Rprofile就是一个代码文件，如果启动时找到这个文件，那么就替我们先运行一遍（这个过程就是在启动Rstudio时完成的） -----...-微信公众号：生信星球首先用file.edit('~/.Rprofile')打开.Rprofile文件；然后在.Rprofile文件内添加下列两行代码# options函数就是设置R运行过程中的一些选项设置...”)：安装Biocductor的包加载R包library(包)或者require(包)Rstudio中包只需要安装一次，但每次启动都需要重新加载R包dplyr包的五个基础函数以R自带的iris数据框为例...test mutate(), 新增列mutate(test, new = Sepal.Length * Sepal.Width) #test

7553 0

Day6生信入门—R包

Rstudio，下载Bioconductor还是会回到官方镜像，可以查询options()$BioC_mirror，如果依然是自己设置的国内镜像，就不用管了；如果发现需要再重新运行一遍代码进行设置，那么使用下面的高级模式...### 高级模式使用R的配置文件.Rprofile 图片 1）首先用file.edit()来编辑文件：file.edit('~/.Rprofile') 2) 然后在左上添加两行options代码：...") library(dplyr) 示例数据直接使用内置数据集iris的简化版: test <- iris[c(1:2,51:52,101:102),] dplyr五个基础函数注意，井号开头的是代码运行记录...可以和自己的运行结果做对比 1.mutate(),新增列 mutate(test, new = Sepal.Length * Sepal.Width) 2.select(),按列筛选 1)按列号筛选 select...(x = test2, y = test1, by = 'x') ## 6.简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，

5442 0

生信星球学习小组Day6笔记--学习R包高小能

认识 R 包R包是多个函数的集合，具有详细的说明和示例。学生信，R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。　包的使用是一通百通的，我们以dplyr为例，讲一下R包。...安装和加载R包1.镜像设置为了保证我们可以自定义CRAN和Bioconductor的下载镜像，其实是可以在Rstudio中进行设置的，只需要运行这两行代码即可：# options函数就是设置R运行过程中的一些选项设置...图片加载library(dplyr)示例数据直接使用内置数据集iris的简化版:test dplyr五个基础函数1.mutate(),新增列mutate...(test, new = Sepal.Length * Sepal.Width)图片2.select(),按列筛选(1)按列号筛选图片(2)按列名筛选图片3.filter()筛选行图片4.arrange...(),按某1列或某几列对整个表格进行排序图片5.summarise()：汇总图片dplyr两个实用技能管道操作 %>% (cmd/ctr + shift + M)count统计某列的unique值dplyr

1670 0

学习小组Day6——学习R包

学习小组Day6——学习R包图片学习R包安装加载R包1.镜像的设置解决R包在国外，下载慢的问题1.初级模式：在Rstuidio程序中设置 Tools-Packages-Primary CRAN repositorry...图片2.高级模式——修改Rstudio配置文件图片生信星球2.安装包可以从CRAN、Biocductor及Github下载安装，指令不同CRAN:install.packages("包")Biocductor...：BiocManager::install("包")Github：devtools::install_github()3.加载library和require，两个函数均可dplyr基础函数1.arrange...()排序2.mutate()新增列或修改列3.slect()、filter()筛选列、行4.优秀的管道符%>%（传递）5.summarise()汇总，一般与group_by()分组连用表格的连接（dplyr...2.按行合并要求两表格有相同的列；按列合并要求两表格有相同的行

2692 0

「R」dplyr 行式计算

「原文来自：dplyr 文档」上一篇：「R」dplyr 列式计算通常 dplyr 和 R 更适合对列进行操作，而对行操作则显得更麻烦。...按行汇总统计 dplyr::summarise() 让一列多行的统计汇总变得非常简单，当它与 rowwise() 结合时，它也可以简便地操作汇总一行多列。...，我们县创建一个行式数据框： rf % rowwise(id) 我们然后使用 mutate() 添加一个新的列，或者使用 summarise() 仅返回一个汇总列： rf %>% mutate...mutate() 将列切分然后传入 length(y) 的时候，分组 mutate 使用 [ 操作，而行式 mutate 使用 [[。...list()意味着我们将得到一个列表列，其中每一行都是一个包含多个值的列表。

6.2K2 0

R语言宏基因组学统计分析(第四章)笔记

）；2、另一个原因是让函数不试图去修正种的名字，来保证系统上的正确（否则，名字中的空间可能变为.）。...在以行和列转换和汇总表格数据方面，非常有用，包括选择行，过滤列、排序行，增加新列和汇总。...重要的函数包括： select() 和 rename() 基于名字选择列(变量) filter() 基于值过滤行(cases) arrange() 重新排序行 (cases) mutate() 和 transmute...()创建新列, 例如, 通过已有变量，调用函数增加新的变量 summarise() 汇总数值 group_by() 分组观察值，分开和合并 sample_n() 和 sample_frac() 随机抽样...另外，dplyr从magrittr包引入了管道%>%，在合并几个函数时非常有用。

1.9K2 0

「R」表格可视化 10+ 指南【前篇】

# fmt_number() 用来设定浮点数 yield_data_wide %>% mutate(crop = str_to_title(crop)) %>% group_by(crop)...fns = list( avg = ~ mean(.), # 添加任意多的汇总 sd = ~ sd(.) ) ) ?...注意下面我们使用 locations 参数标记要修饰的表格列，而这里并不是指在数据中的位置（2:5），另外我们还可以使用 vars(name)（类似上面）设定。...image-20201011222257618 修改展示我们可以利用 tab_options() 自定义表格外观。所有支持的设定请阅读文档[8]。...image-20201011222503386 ❝gt 会自动修改文字的颜色以增强对比度，通过 autocolor_text = FALSE 关闭该特性。

1.2K2 0

R语言之 dplyr 包

使用 select( ) 选择列函数 select( ) 用于选择数据框中的列（变量）。 # 下面的命令选择数据框里面的 bwt、age、race 和 smoke 这 4 个变量组成新的数据框。...4.使用 mutate( ) 添加新变量函数 mutate( ) 用于在数据框中创建新的变量。...# 当然如果想要用新变量替换原来的变量，只需把新变量命名为原来的变量名： mutate(birthwt, lwt.kg = lwt*0.4536) 5.使用 summarise( ) 计算统计量函数...与 R/Rstudio 上不同，notebook 这里把它显示成了 A grouped_df: 189 × 10（而非 # A tibble: 189 x 10)，实际它仍然包含 tibble（注意其中的...# 第一步把数据框 birthwt 里面的变量 race 转换成因子并给各个水平添加标签，把新的数据框命名为 birthwt1 birthwt1 mutate(birthwt,

4502 0

R数据科学整洁之道：使用dplyr操作数据表

dplyr 是 tidyverse 包的一部分，提供了许多操作数据框的工具，常用的有： filter 选择行 select 选择列 mutate 新增列 arrange 排序 summarize 生成摘要...，可在 Rstudio 的控制台输入 ?...- 新增列除了选择现有的列，我们还经常需要添加新列，新列是现有列的函数。...如果列名不只一个，那么就使用后面的列在前面排序的基础上继续排序： arrange(mpg, model, displ) ## # A tibble: 234 × 11 ## manufacturer...接下来，在分组后的数据框上使用 dplyr 函数时，它们会自动地应用到每个分组。

9293 0

生信星球学习day6-毽子

R包学习1.镜像设置为了保证我们可以自定义CRAN和Bioconductor的下载镜像，其实是可以在Rstudio中进行设置的，只需要运行这两行代码即可：options("repos" = c(CRAN...")library(dplyr)dplyr五个基础函数先导入示例数据再操作示例数据直接使用内置数据集iris的简化版:test mutate(...),新增列mutate(test, new = Sepal.Length * Sepal.Width)图片select 按列筛选select(test,1)图片select(test,c(1,5))图片...两个实用技能1：管道操作 %>% (cmd/ctr + shift + M)（加载任意一个tidyverse包即可用管道符号）图片2：count统计某列的unique值count(test,Species...(x = test2, y = test1, by = 'x')图片6.简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，而bind_cols

6340 0

什么是sparklyr

我们（RStudio Team）今天很高兴的宣布一个新的项目sparklyr（https://spark.rstudio.com），它是一个包，用来实现通过R连接Apache Spark。...[320ghku1ob.png] 在过去的几年里，我们总是在听说大家需要一个连接Spark的源生的dplyr（https://github.com/tidyverse/dplyr）接口，于是我们开发创建了一个.../preview/），这个新的IDE包含了集成Spark的功能提升。...的包，你就可以在IDE中发现“Spark”面板。...这个面板包含了一个“新的连接”会话，用来连接本地或者远程的Spark。

2.3K9 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在列表/ dplyr / mutate / List / Rstudio内的datafame上修改新列

基础概念

相关优势

类型与应用场景

示例代码

常见问题及解决方法

参考链接

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐