首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据清洗与管理之dplyr、tidyr

本期回顾 R语言 | 第一部分:数据预处理 R语言|第2讲:生成数据 R语言常用的数据输入与输出方法 | 第三讲 本期目录 0 二维数组行列引用 1 创建新变量 2 变量重新编码 3 变量重新命名 4...可用于将连续数据编码为分组数据,或者替代异常值等 在R中重新编码数据常用逻辑运算符,通过TRUE/FALSE等返回值,确定编码的位置。...> df <- iris #将Petal.Length列等于1.4的位置重新编码为“” > df$Petal.Length[df$Petal.Length == 1.4] <- "" > head(...") [1] "omit" 5 dplyr包的下述五个函数用法【高级数据管理包】 # install.packages("dplyr") library(dplyr) #使用datasets包中的mtcars...key #value:将原数据框中的所有值赋给一个新变量value #…:可以指定哪些列聚到同一列中 #na.rm:是否删除缺失值 widedata <- data.frame(person=c('Alex

1.9K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    「R」数据操作(五):dplyr 介绍与数据过滤

    这里我们使用dplyr包操作2013年纽约市的航班起飞数据集(2013)。 准备 这部分我们聚焦于如何使用dplyr包,除ggplot2的另一个tidyverse核心成员。...## lag(): dplyr, stats 注意一下你导入tidyverse包时给出的冲突信息(Conflicts),它告诉你dplyr覆盖了R基础包中的函数。...你可能已经注意到每个列名下面有三到四个字母的缩写。...基础 这部分我们学习5个关键的dplyr函数,它可以让我们解决遇到的大部分数据操作问题: 根据值选择观察(记录),filter() 对行重新排序,arrange() 根据名字选择变量,select()...NA > 5 ## [1] NA 10 == NA ## [1] NA NA + 10 ## [1] NA NA / 2 ## [1] NA 最让人困惑的结果是这个: NA == NA ## [1]

    2.6K11

    「R」dplyr 列式计算

    原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多列执行相同的函数操作经常有用...最后我们将简要介绍一下历史,说明为什么我们更喜欢 across() 而不是后一种方法(即 _if(), _at(), _all() 变体函数)以及如何将你的旧代码转换为新的语法实现。...」 动词函数一起工作: •重新缩放所有数值变量到范围 0-1: rescale01 <- function(x) { rng na.rm = TRUE) (x - rng...令人失望的是,我们没有早点发现 across(),而是经历了几个错误的尝试(首先没有意识到这是一个常见的问题,然后是使用_each()函数,最后是使用_if()/_at()/_all()函数)。...你如何转移已经存在的代码?

    2.4K10

    生信爱好者周刊(第 28 期):华大Stereo-seq系列成果揭秘超高分辨率生命全景时空图谱

    该技术作为新时代的分子 “显微镜”,为重新认知器官结构、生命发育、物种演化和定义人类疾病提供了底层工具,将推动继显微镜和DNA测序技术以来的生命科学领域第三次科技革命。...在每个阵列中,包含2万到4万个柱子,每个珠子中,可以检测到的DNA序列,约为165-421个。...4、2021年人工智能研究成果盘点 文章 1、GitHub,版本控制与协作[3] 本文介绍如何使用GitHub进行版本控制与协作。...library(conflicted) library(dplyr) filter(mtcars, cyl == 8) #> Error: [conflicted] `filter` found in...a preference with `conflict_prefer()` #> * conflict_prefer("filter", "dplyr") #> * conflict_prefer("

    1.2K10

    tidyverse

    背景 Tidyverse 是 Rstudio 公司推出的专门使用 R 进行数据分析的一整套工具集合,里面包括了readr,tidyr, dplyr,purrr,tibble,stringr...tidyr 与 dplyr 包是用 R 语言中用来处理各种数据整合分析的包,可以说是 R 数据整合的“瑞士军刀”,tidyr 包负责将数据重新整合,dplyr 包可以完成数据的排序,筛选,分类计算等都等操作...官网:https://www.tidyverse.org/ 一、tidyr 数据整理 tidyr 包用于将数据重新整合,替代之前的 reshape 和 reshape2 包,用于数据的重塑与聚合...数据的整理是一个从数据框的统计结构(变量与观察值)到形式结构(列与行)的映射。...melt 将数据转换为长数据,cast 重新调整变量。tidyr 数据转换也是类似的方法。

    1.7K10
    领券