dplyr: mutate()和mutate_if() - 腾讯云开发者社区

一般使用dplyr R包中以下R函数： Mutate（）：计算新变量并将其添加到数据表中。它保留了现有的变量。 Transmutate（）：计算新列但删除现有变量。...同时还有mutate（）和transmutate（）的三个变体来一次修改多个列： Mutate_all（）/ transmutate_all（）：将函数应用于数据框中的每个列。...（）/ transmutate_all（），mutate_at（）/ transmutate_at（）和mutate_if（）/ transmutate_if（）可用于一次修改多个列。...mutate_if（）对于将变量从一种类型转换为另一种类型特别有用。...# 将所有因子列转化成字符 my_data %>% mutate_if(is.factor, as.character) # 将左右数字列四舍五入 my_data %>% mutate_if(is.numeric

4.2K2 0

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...但你也可以联合 across() 和任意其他的「dplyr」动词函数，我们后面会提及。...对于 _if()，原来的第二个参数包裹进 where() 对于 _at()，原来的参数，如果有 vars() 包裹则移除对于 _all()，使用everything() 例如： df %>% mutate_if...这与 mutate_if()、mutate_at() 和 mutate_all() 不同，后者一次只完成一个转换。...」的开发者们通过 across() 简化了「dplyr」对于一些数据复杂操作的处理逻辑，提高了整体的学习和使用效率，让我们使用者更关注于逻辑而非实现上。

2.4K1 0

您找到你想要的搜索结果了吗？

是的

没有找到

每天 5 分钟，轻轻松松上手 R 语言（七）

今天的我们继续来看 dplyr 的 arrange 和 mutate。...批量处理，当两者都有的时候，就不太好用了这时就该用 mutate_if 了。...round")(name) : non-numeric argument to mathematical function 我们可以用 mutate_if 加一个判断条件，若是数值型就把它四舍五入；...msleep %>% + mutate_if(is.numeric, round) %>% glimpse() Observations: 83 Variables: 11 $ name...是非常强大的，mutate_* 系列函数还有很多高级用法，后面我们用到的时候还会接着讨论，现在拿起 mutate 把你的数据重新打造一遍吧！

6611 0

数据处理第2节：将列转换为正确的形状

博客原文：https://suzan.rbind.io/2018/01/dplyr-tutorial-1/ 作者：Suzan Baert 这是一系列dplyr函数中的第二篇文章。...就像第1部分中的select（）函数一样，mutate（）有变种： *mutate_all（）将根据您的进一步说明改变所有列 *mutate_if（）首先需要一个返回布尔值的函数来选择列。...如果同时具有数字和字符列，则尝试对数据进行舍入将导致错误。...在这些情况下，我们必须在给出round（）指令之前添加列需要为数字的条件，这可以使用mutate_if来完成。通过使用mutate_if（），我们在管道中需要两个参数：首先，它需要有关列的信息。...msleep %>% select(name, sleep_total:bodywt) %>% mutate_if(is.numeric, round) ## # A tibble: 83 x

8.1K3 0

使用decoupleR一次性实现11种基因集的活性打分（R与Python我都要）

::mutate_if(~ any(is.na(.x)), ~ dplyr::if_else(is.na(.x), 0, .x)) %>% tibble::...dplyr::arrange(target) %>% dplyr::mutate(ID = target, color = "3") %>%...<- df[inter, ] df['t_value'] <- deg[inter, ] df % dplyr::mutate(color = dplyr::if_else...% dplyr::mutate(color = dplyr::if_else(weight 0, '2', color...)) %>% dplyr::mutate(color = dplyr::if_else(weight < 0 & t_value < 0, '1', color)) colors <- rev

5291 0

R海拾遗-tidyverse

---------------- tidyverse 1.3.0 -- ## √ ggplot2 3.3.2 √ purrr 0.3.4 ## √ tibble 3.0.3 √ dplyr...Conflicts ---------------------------------------------------------------- tidyverse_conflicts() -- ## x dplyr...::filter() masks stats::filter() ## x dplyr::lag() masks stats::lag() # 建立测试数据集 my_data <- as_tibble...0.4 2.13 ## # ... with 1 more variable: Petal.Width_cm # 转换变量类型 my_data %>% mutate_if...0.2 setosa ## 6 5.4 3.9 1.7 0.4 setosa # 小数点处理 my_data %>% mutate_if

1.2K1 0

ggpol包优雅的绘制蝴蝶图

计算每组的数量 ungroup() %>% # 解除分组 unite(col = "status_gender", gender, status, sep = "_") %>% # 将性别和选举状态合并成一个新的列...constituency, -ratio) %>% # 宽表转长表 separate(category, into = c("gender", "status")) %>% # 将category列分成性别和状态两列...", status == "elected" & ratio == 1 ~ "Gender balance")) %>% mutate_if...根据性别标签分面 coord_flip() + # 翻转坐标轴，使选区显示在y轴 scale_x_discrete(name = NULL,expand = c(0,1), # 调整x轴比例和标签...results$constituency))) + scale_y_continuous(name = NULL, breaks = NULL,expand = c(0,1)) + # 调整y轴比例和标签

3711 0

R优雅的给环状热图添加显著性标记

read.delim("genus.xls",sep="\t") %>% head(60) %>% column_to_rownames(var="OTU.ID") dat2 % mutate_if...is.numeric,function(x) x+ 1) %>% log10() %>% rownames_to_column(var="ID") %>% pivot_longer(-ID) %>% mutate...color = "grey50",offset = 0.04,size = 0.02)+ geom_fruit(data=dat2 %>% mutate

5391 0

「R」数据操作（六）：dplyr 排序和选择

使用arrange()排列行 arrange()函数工作原理和filter()相似，但它不是选择行，而是改变行的顺序。它使用一个数据框和一系列有序的列变量（或者更复杂的表达式）作为输入。

4.1K1 0

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

Fama French 因子的导入和整理我们的首要任务是获取 FF 数据，幸运的是，FF 在互联网上提供了他们的因子数据。我们将记录导入和清理这些数据的每个步骤。...ff\_proio\_tns <- piruq\_ealaed\_ntly %>% left_join %>% mutate head(ff_poleus, 4) 我们现在有了一个包含我们的投资组合收益和...ffdlrhd <- ffptoltus %>% do) %>% tidy(conf.level = .95) fdlyd %>% mutate_if %>% select...我们的模型对象现在包含一个 conf.high 和 conf.low 列来保存我们的置信区间最小值和最大值。...fdpynd %>% mutate_if%>% filter %>% ggplot+ geom_point + geom_errorbar + labs + theme_minimal

3.9K3 0

使用 R 语言从 PDF 文档中提取表格

mutate(dest = str_match(value, "situation-reports/(.*)\\?")...is.na(Total_confirmed_cases)) %>% dplyr::filter(!...is.na(Total_confirmed_new_cases)) %>% dplyr::filter(!...is.na(Total_confirmed_cases)) %>% dplyr::filter(!...is.na(Total_confirmed_new_cases)) %>% dplyr::filter(!

3.7K1 0

「R」dplyr 包使用

(.data, ...)生成新列 > mutate(mtcars, gpm = 1/mpg) mpg cyl disp hp drat wt qsec vs am gear carb...0.8479969 5.754888 3 3.333 74 1.2038728 4.304065 1.7368213 6.209453 mutate_if...(data, 判断条件, funtion) > mutate_if(iris, is.numeric, funs(log(.)))...(.tbl, .cols, .funs, ...)把函数应用到数据框指定的列举例：vars(-Species)表示除了这列，对其他的进行运算 > mutate_at(iris, vars(-Species...bind_rows(..., id = NULL) id是增加的新列的名字 intersect(x, y, ...)取得同时出现在x和y两个数据框中的行 ?

1.1K2 0

UseGalaxy.cn生信云|零代码使用Tiverse优雅地处理数据集

TIDYVERSE Dplyr Arrange rows Dplyr Count the observations Dplyr Distinct keep unique rows Dplyr Join...two tables Dplyr Join with one varibale Dplyr Mutate create, modify, and delete columns Dplyr Rename...Dplyr Join two tables join 函数用于根据指定的键将两个数据框连接起来，可以根据共同的变量将数据框进行合并，支持多种连接操作，如内连接、左连接、右连接和外连接等。...Dplyr Mutate create, modify, and delete columns mutate 函数用于添加新变量或修改现有变量，能够基于已有数据创建新的变量列，支持对数据框进行实时的变量操作和修改...Tidyr Pivot Longer from wide pivot_longer 函数用于将宽格式数据转换为长格式数据，能够根据用户指定的列将数据框中的多个列整理成一对 “名-值” 对，便于进一步的分析和处理

1722 0

R语言包_dplyr_1

有5个基础的函数： - filter - select - arrange - mutate - summarise - group_by (plus) 可以和databases...载入数据 library(plyr) library(dplyr) # load packages suppressMessages(library(dplyr)) install.packages(...desc` for descending flights %>% select(UniqueCarrier, DepDelay) %>% arrange(desc(DepDelay)) mutate...(Speed = Distance/AirTime*60) # store the new variable flights % mutate(Speed = Distance...from the previous month flights %>% group_by(Month) %>% summarise(flight_count = n()) %>% mutate

9612 0

数据分析：宏基因组数据的荟萃分析

gender数目和比例筛选符合要求的研究datasets_tokeep % dplyr::select(study_name, gender) %>% dplyr::group_by..."), N=n()) %>% dplyr::mutate(keep = (pmin(n_males, n_females) >= 40) & (n_females...is.na(RE)) %>% dplyr::filter(FDR_Qvalue % dplyr::group_by(Species) %>% dplyr::mutate(RE_lower...::ungroup() %>% dplyr::mutate(RE_new = round(as.numeric(RE), 2), RE_lower = round(as.numeric...is.na(RE)) %>% dplyr::filter(FDR_Qvalue % dplyr::group_by(Species) %>% dplyr::mutate(RE_lower

1311 0

Python从零开始第三章数据处理与分析python中的dplyr（5）目录

目录第二章（pandas） Python从零开始第三章数据处理与分析python中的dplyr（1） Python从零开始第三章数据处理与分析python中的dplyr（2） Python从零开始第三章数据处理与分析...python中的dplyr（3） Python从零开始第三章数据处理与分析python中的dplyr（4） Python从零开始第三章数据处理与分析python中的dplyr（5） ==========...1.891421e+07 61.264673 1.342755 4 Very Good 3981.759891 1.548973e+07 61.818275 1.900466 lead（）和lag...3 334 4.0 4 335 5.0 5 336 6.0 cumsum（）函数 cumsum（）函数计算列的累积和。...diamonds >> select(X.price) >> mutate(price_cumsum=cumsum(X.price)) >> head(6) price price_cumsum

9823 0

R数据科学-1（dplyr）

# select mtcars %>% as.tbl() %>% dplyr::select(mpg,cyl,am,gear) # mutate mtcars %>% as.tbl() %>%...dplyr::select(mpg,cyl,am,gear) %>% mutate(mpg1=mpg, new=mpg*cyl) # A...# filter df = mtcars %>% as.tbl() %>% dplyr::select(mpg,cyl,am,gear) %>% mutate(mpg1=mpg,...# transfer df = mtcars %>% as.tbl() %>% dplyr::select(mpg,cyl,am,gear) %>% mutate(mpg1=as.character...代码如下 df = mtcars %>% as.tbl() %>% dplyr::select(mpg,cyl,am,gear) %>% mutate(mpg1=ifelse(mpg<25,

1.6K2 0

dplyr数据处理

library(dplyr) dplyr::filter(iris,Sepal.Length >7) dplyr::filter(mtcars,mpg>21) dplyr::filter(mtcars,...mtcars %>% dplyr::filter(mpg>20) mtcars %>% dplyr::filter(mpg>20) %>% dplyr::arrange(cyl) 四、筛选过滤列 select...mtcars %>% dplyr::sample_n(10) mtcars %>% dplyr::sample_frac(0.2) 六、创建新变量有时需要对已有变量进行重新计算，例如计算几列的和...，会某一列取对数，这样将生成新的变量，这个时候可以使用 mutate 函数。...mtcars %>% dplyr::mutate(mpg10 = mpg*10) x <- read.xlsx('2015.xlsx') x %>% dplyr::mutate(avg = Income

1.5K1 0

Day3-学习R包

install.packages("dplyr")：这行代码用于安装名为 dplyr 的R包。...五个基础函数 mutate() 函数是 dplyr 包提供的一个用于修改数据框（data frame）的函数，它可以创建新的列或者修改现有的列。...mutate(.data, new_column_name = expression) mutate(test, new = Sepal.Length * Sepal.Width) ##在数据框 test...中，创建一个名为 new 的新列，该列的每个值是对应行中 Sepal.Length 和 Sepal.Width 的乘积 select(test,1) ##从数据框 test 中选择第一列。...###按照Sepal.Length列从小到大排序 summarise(test, mean(Sepal.Length), sd(Sepal.Length)) # 计算Sepal.Length的平均值和标准差

1421 0

R语言中这个筛选差异基因的方式可读性很好，值得推荐

::case-when 标记差异基因比之前简洁了一些，可读性强 library(dplyr) res_output %>% mutate(level = case_when( (padj% mutate(level = if_else(res_output$padj=log2FC...) res_output %>% mutate(diff_gene = case_when( (padj=log2FC) ~ Gene...) res_output %>% mutate(rank=1:n(), keep_gene = case_when( rank %% 2 == 1 ~...dplyr::if_else速度最快！

7714 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R语言第二章数据处理⑤数据框列的转化和计算目录正文

「R」dplyr 列式计算

每天 5 分钟，轻轻松松上手 R 语言（七）

数据处理第2节：将列转换为正确的形状

使用decoupleR一次性实现11种基因集的活性打分（R与Python我都要）

R海拾遗-tidyverse

ggpol包优雅的绘制蝴蝶图

R优雅的给环状热图添加显著性标记

「R」数据操作（六）：dplyr 排序和选择

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

使用 R 语言从 PDF 文档中提取表格

「R」dplyr 包使用

UseGalaxy.cn生信云|零代码使用Tiverse优雅地处理数据集

R语言包_dplyr_1

数据分析：宏基因组数据的荟萃分析

Python从零开始第三章数据处理与分析python中的dplyr（5）目录

R数据科学-1（dplyr）

dplyr数据处理

Day3-学习R包

R语言中这个筛选差异基因的方式可读性很好，值得推荐

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐