使用dplyr transmute时，exists函数无法按预期工作 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数据处理|R-dplyr

1）安装、加载dplyr包、准备数据 install.packages("dplyr") #加载dplyr包使用dplyr包处理数据前，建议先将数据集转换为tbl对象。...data(iris) #本文使用iris示例数据集。 2）数据记录筛选（行筛选） filter函数:按指定条件筛选符合条件中逻辑判断要求的数据记录。...mutate(iris,sepal = Sepal.Length + Sepal.Width) transmute()函数在扩展新变量的时候，会删除所有原始变量。...transmute(iris,sepal = Sepal.Length + Sepal....11）数据合并 dplyr包中也添加了类似cbind()函数和rbind()函数功能的函数，它们是bind_cols()函数和bind_rows()函数。

2K1 0

R语言第二章数据处理⑤数据框列的转化和计算目录正文

一般使用dplyr R包中以下R函数： Mutate（）：计算新变量并将其添加到数据表中。它保留了现有的变量。 Transmutate（）：计算新列但删除现有变量。...Mutate_at（）/ transmutate_at（）：将函数应用于使用字符向量选择的特定列 Mutate_if（）/ transmutate_if（）：将函数应用于使用返回TRUE的谓词函数选择的列...) # Transmutate variants transmute_all(.tbl, .funs, ...) transmute_if(.tbl, .predicate, .funs, ...)...transmute_at(.tbl, .vars, .funs, ...)...转换特定列 mutate_at（）：转换按名称选择的特定列： my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),

4.2K2 0

您找到你想要的搜索结果了吗？

是的

没有找到

使用dplyr进行数据转换

library(nycflights13) library(tidyverse) dplyr最常用的5个函数： • 按值筛选观测(filter())。...• 按名称选取变量(select())。 • 使用现有变量的函数创建新变量(mutate())。 • 将多个值总结为一个摘要统计量(summarize())。...函数的使用方法： (1) 第一个参数是一个数据框。 (2) 随后的参数使用变量名称(不带引号)描述了在数据框上进行的操作。 (3) 输出结果是一个新数据框。...如果列名不只一个，那么就使用后面的列在前面排序的基础上继续排序 arrange(flights, year, month, day) 使用 desc() 可以按列进行降序排序: arrange(flights...transmute() 函数: transmute(flights, gain = arr_delay - dep_delay, hours = air_time

9731 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

我们可以使用tidyverse 系统来操作，其中包括了magrittr 包，readr 包，dplyr 包和 tidyr 包等。...dplyr 包的 distinct() 函数可以对数据框指定若干变量，然后筛选出所有不同值，每组不同值仅保留一行。...) rename() 这个函数可能出现在其它包中，保险起见写成 dplyr::rename()。...按列号 select(test,1) select(test,c(1,5)) 按列名如果想要用向量来存放希望筛选的列名，需要使用函数 one_of 来存放该向量。...对于待分离的对象（col），不必加上引号；但对于即将创建的新列（into），需要使用引号，由于是两列，这里使用向量创建。sep参数设定读取表格信息时以何符号作为分隔符。

10.9K3 0

R数据科学|3.5内容介绍及习题解答

上节我们对选择现有的列进行了介绍与习题解答，现在对数据框添加新列进行介绍，这里使用mutate()函数，注意：mutate()总是将新列添加在数据集的最后。...transmute()函数： transmute(flights, gain = arr_delay - dep_delay, hours = air_time / 60, gain_per_hour...创建新变量的多种函数可供你同mutate()一同使用。...偏移函数：lead()和lag()函数它们可以返回一个序列的领先值和滞后值。它们可以计算出序列的移动差值（如）或发现序列何时发生了变化（）。它们与group_by()组合使用时特别有用。...cumsum()、cumprod()、commin()和cummax()；dplyr 还提供了cummean()函数以计算累加均值。

2.6K5 0

「R」forestmodel给多水平变量添加整体p值

我展示了一个示例： > library("survival") > library("dplyr") > pretty_lung % + transmute(time, +...想办法把上图中右侧的reference在需要时右侧添加文字就好了。通过添加一个新的参数来控制这种行为。...安装包： remotes::install_github("ShixiangWang/forestmodel") 看看效果： library("survival") library("dplyr")...library("forestmodel") pretty_lung % transmute(time, status, Age...有使用ezcox包的读者可以试试。由于做了不少维护和开发工作，就这两天forestmodel作者将我加入了作者列表[1]。这算是无心插柳吗？

8051 0

R语言宏基因组学统计分析(第四章)笔记

原来图的函数用错了，是boxplot ? 可以使用ggplot2画更高品质的图。...)))),rep("cecal", length(grep("CeSt", colnames(tab)))))) 4.2 dplyr包简介 dplyr包提供了一系列数据操纵函数，是plyr包的第二版，...重要的函数包括： select() 和 rename() 基于名字选择列(变量) filter() 基于值过滤行(cases) arrange() 重新排序行 (cases) mutate() 和 transmute...另外，dplyr从magrittr包引入了管道%>%，在合并几个函数时非常有用。...与之前的函数嵌套从里到外调用不同，管道是从左到右依次传递，例如： install.packages("dplyr") library(dplyr) head(iris) # Sepal.Length

1.9K2 0

每天 5 分钟，轻轻松松上手 R 语言（七）

今天的我们继续来看 dplyr 的 arrange 和 mutate。...arrange 行排序我们想按 sleep_total 降序排列行，可以使用 desc 函数; msleep %>% arrange(desc(sleep_total)) %>% glimpse()...0.01080, 0.01550,… $ bodywt 0.010, 0.023, 0.370, 60.000, 1.700, 3.500, 0.480, 0.920, … 当有缺失值时，...方法; msleep %>%transmute(newcol=sleep_total-1) %>% + select(newcol, everything()) %>% glimpse() Observations...bodywt 50, 0, 1, 0, 600, 4, 20, 0, 14, 15, 34, 1, 5, 0, 0, 1, 0,… 如果我们想要针对列名而不是数据进行变换，可以使用

6611 0

「R」数据操作（七）：dplyr 操作变量与汇总

使用mutate()添加新变量除了选择已存在的列，另一个常见的操作是添加新的列。这就是mutate()函数的工作了。 mutate()函数通常将新增变量放在数据集的最后面。...这些函数的一个关键属性就是向量化的：它必须使用一组向量值作为输入，然后返回相同长度的数值作为输出。我们没有办法将所有的函数都列举出来，这里选择一些被频繁使用的函数。...然后，当你使用dplyr动词对分组的数据框进行操作时，它会自动进行分组计算。...使用管道进行工作是属于tidyverse的一个重要标准。唯一的例外是ggplot2，它在管道开发之前就已经写好了。不幸的是，ggplot2的下一个版本ggvis会使用管道，但还没有发布。...有用的汇总函数仅仅使用均值、计数和求和这些函数就可以帮我做很多事情，但R提供了许多其他有用的汇总函数：位置度量我们已经使用过mean()函数求取平均值（总和除以长度），median()函数也非常有用

2.6K2 0

「R」生存分析森林图玩法：变量筛选与多模型可视化

之前在写 metawho 包的 deft_show() 函数时用到了 forestmodel 包展示元分析模型结果，后面还用到了我发表在 eLife 上的 TIGS 文章中（当时谁能想到呢？）。...forestmodel 包还支持常用的一些模型，如 lm、glm 以及 cox，生存分析使用的 Cox 模型是我比较常用的，之前还修过几个bug，最近想做下批量的单变量Cox分析并进行可视化，碰巧记得...("ShixiangWang/forestmodel") 这里用示例数据演示下变量筛选的效果： library("forestmodel") library("survival") library("dplyr...") pretty_lung % transmute(time, status, Age = age, Sex

1.6K1 1

Day07 生信马拉松-数据整理中的R

全文并非是对数据整理的实操整理,主要整理在数据整理/清洗中常用的R包介绍 library(tidyr) library(dplyr) library(stringr) library(tibble) 1...str_split(y," ",simplify = T) #"simplify"参数默认拆分取为matrix str_split(y," ",simplify = T) [,1] #只拆分提取第1列 1.3 按位置提取字符串...as.matrix() %>% head(50) %>% pheatmap::pheatmap() 3.条件和循环 3.1 if(){ } 3.1.1 只有if没有else，那么条件是FALSE时就什么都不做...dir() # 列出工作目录下的文件 dir(pattern = ".R$") #列出工作目录下以.R结尾的文件 file.create("douhua.txt") #用代码创建文件 file.exists...("douhua.txt") #某文件在工作目录下是否存在 file.remove("douhua.txt") #用代码删除文件 file.exists("douhua.txt") #删掉了就不存在啦

2390 0

玩转数据处理120题｜R语言版本

expending函数计算开盘价的移动窗口均值难度：⭐⭐ R解法 #R中没有expanding完全一致的函数 #考虑到expanding实际功能就是累积均值 #可以用cummean #但cummean...)) %>% dplyr::rename(`0` = "seq(0, 99, 5)") 84 数据创建题目：从NumPy数组创建DataFrame 难度：⭐ 备注使用numpy生成20个指定分布...df的每一行均值难度：⭐⭐ R语言解法 rowMeans(df) 97 数据计算题目：对第二列计算移动平均值难度：⭐⭐⭐ 备注每次移动三个位置，不可以使用自定义函数 R语言解法 library...：将第一列大于50的数字修改为'高' 难度：⭐⭐ R语言解法 df[df$col1 > 50,1] <- '高' 100 数据计算题目：计算第一列与第二列之间的欧式距离难度：⭐⭐⭐ 备注不可以使用自定义函数...#如果文件特别大又不想全部再选指定列可以用如下办法 #基本思想先读取较少的数据获取列名 #给目标列以外的列打上NULL导致第二次读取文件时NULL列丢失即可 res <- read.csv('数据1

8.9K1 0

基于R语言股票市场收益的统计可视化分析

要计算累积收益，我们将使用 cumprod（）函数。...mutate(cr = cumprod(1 + nflx_returns)) %>% # 使用cumprod函数 ggplot(aes(x = date, y = cumulative_returns...这不是我们预期的结果。由于这些股票具有巨大的价格差异（FB低于165，AMZN高于1950），因此它们的规模不同。我们可以通过按各自的y比例绘制股票来克服此问题。...为此，我们将使用 mean（）和 sd（）函数。...我们可以通过按年份对Netflix收益数据进行分组并执行计算来进行计算。

1.5K1 0

Day6 R包安装和学习

1.镜像设置镜像网站相当于主网站的副本，访问主网站存在障碍时，访问镜像网站也可。存放R包的网站位于国外，选择国内的镜像可加快访问速度。...使用一个包，是需要先安装再加载，才能使用包里的函数。以“dplyr”为例。...dplyr五个基础函数1.mutate(),新增列mutate(test, new = Sepal.Length * Sepal.Width)2.select(),按列筛选(1).按列号筛选(2).按列名筛选...(3).filter()筛选行(4).arrange(),按某1列或某几列对整个表格进行排序(5).summarise()：汇总dplyr两个实用技能1：管道操作 %>% (cmd/ctr + shift...semi_join5.反连接：返回无法与y表匹配的x表的所记录anti_join6.简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同

1241 0

基于R语言股票市场收益的统计可视化分析|附代码数据

要计算累积收益，我们将使用 cumprod（）函数。 ...mutate(cr = cumprod(1 + nflx_returns)) %>% # 使用cumprod函数 ggplot(aes(x = date, y = cumulative_returns...我们可以通过按各自的y比例绘制股票来克服此问题。 ...为此，我们将使用 mean（）和 sd（）函数。...我们可以通过按年份对Netflix收益数据进行分组并执行计算来进行计算。

2982 0

基于R语言股票市场收益的统计可视化分析

要计算累积收益，我们将使用 cumprod（）函数。...mutate(cr = cumprod(1 + nflx_returns)) %>% # 使用cumprod函数 ggplot(aes(x = date, y = cumulative_returns...我们可以通过按各自的y比例绘制股票来克服此问题。...为此，我们将使用 mean（）和 sd（）函数。...我们可以通过按年份对Netflix收益数据进行分组并执行计算来进行计算。

2.1K0 0

学习小组DAY6-Creep

今天的学习内容是R包，R包是多个函数的集合，本次主要是学习dplyr包。安装和加载R包设置镜像每次下载R包时，都需要重新配置镜像。...为了避免这种繁琐的操作可以使用file.edit('~/.Rprofile')建一个R的配置文件文件直接进行设置，在配置文件中运行以下代码options("repos" = c(CRAN="https:...:102),]dplyr五个基础函数mutate()，新增列select(),按列筛选filter()筛选行arrange(),按某1列或某几列对整个表格进行排序summarise()：汇总进行汇总时可以结合...其实就是以左边那个表格作为连接的依据找到对应的值，如果没有就以NA表示全连full_join半连接：返回能够与y表匹配的x表所有记录semi_join反连接：返回无法与y表匹配的x表的所记录anti_join...简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，而bind_cols()函数则需要两个数据框有相同的行数以上就是本次的学习内容了

1738 0

R||R语言基础（三）_R包

今天继续学习R语言基础的R包使用，以R包：dplyr为例数据准备 01 R包的安装 install.packages(“dplyr”) 或BiocManager::install(“dplyr”)...dplyr五个基础函数 1. mutate() 增加列 mutate(test, new = Sepal.Length * Sepal.Width) #增加名为“new”的一列 2.select...() 按列筛选 1)按列号筛选 select(test,1) select(test,c(1,5)) #提取第一列和第五列由上图可以看出直接提取也是可以的 2)按列名筛选 select(test...其核心包有ggplot、readr、tibble、purrr、 tidyr 、dplyr、ggplot、forcats 和stringr8个. 我们这里用的是dplyr包，因此可以使用管道。...anti_join 反连接:返回无法与y表匹配的x表的所记录(semi_join的anti版本) anti_join(x = test1, y = test2, by = 'x') 6.bind_rows

3.4K5 0

100000个故事的情节分析:一个简单案例

根据我对文本挖掘的习惯，我将使用Julia Silge和我在去年开发的tidytext软件包。...然后我们将这些文件读入R，然后将它们与dplyr使用结合。...= "") 然后，我们可以使用tidytext将情节整理为一个简洁的结构，一个词一行。...中间部分的词汇分布的相对分散（比如，在该部分中出现的比例为14％，而不是预期的10％），但它们仍然是故事结构中很有意义的词汇。我们可以把其中代表性强的单词的完整趋势绘制出来看看。...但开头相对平缓一点，然后矛盾开始逐步凸显出来，在80-90％的高潮时。

1.9K5 0

学习R包

使用一个R包：先安装，再加载，最后使用实操代码（依旧以dplyr为例）options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"...dplyr包有很多函数，为了防止dplyr包中的函数名与其他函数产生冲突，使用时前面加上“包名::”dplyr五个基础函数mutate(),新增列select(),按列筛选按列号筛选注意筛选内容与表格内容的统一...，包括大小写按列名筛选filter()筛选行arrange(),按某1列或某几列对整个表格进行排序arrange(test, Sepal.Length)#默认从小到大排序arrange(test, desc...注意返回的表的不同反连接：返回无法与y表匹配的x表的所记录anti_join注意返回的表的不同简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同...dplylr可以用问号连接任何想知道使用方式的函数名称找R包介绍页面（善用搜索引擎，或者找帮助）##Vignettes这个单词硬翻译会翻译成“小插图”，其实就是作者写的网页版教程，不是每个R包都有的，可以运行代码试试看

1231 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭