首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

R语言数据处理:飞机航行距离与到达延误时间有什么关系??

包,该软件包的飞机航班数据将用于本文中dplyr包相关函数的演示。...处理数据之前,让我们再来回顾一下数据处理的一般步骤: 选择子集、列名重命名、删除缺失数据、处理日期、数据类型转换、数据排序 接下来,就可以进行数据处理了: 2.数据处理 2.1 选择子集 所谓选择子集...2.3 删除缺失数据 我们采用dplyr的filter()函数,进行缺失数据的删除。脚本输入代码: myFlights <- filter(myFlights,!...3.1 数据分组 dplyr包里的分组是由group_by()函数实现的,脚本输入代码: by_dest <- group_by(myFlights, destination) class(by_dest...3.2 应用函数及组合结果 我们使用dplyr的summarize()函数,进行数据统计指标的获取及组合。计算出不同目的地的平行航行距离以及平均延误时间。

3K40

「R」dplyr 列式计算

近期使用 「dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列的 「dplyr函数变体已经过期,看来后续要退休了,使用 across() 是它们的统一替代品,所以最近抽时间针对性的学习和翻译下...原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多列执行相同的函数操作经常有用...这意味着它们会一直存在,但不会获得任何新功能,只会修复关键的bug。 为什么我们喜欢 across()? 为什么我们决定从上面的函数迁移到 across()?...这使 「dplyr」 更容易使用(因为需要记住的函数更少),也使我们更容易实现新的动词(因为我们只需要实现一个函数,而不是四个)。..._at() 函数是 「dplyr唯一你需要手动引用变量名的地方,这让它们比较奇怪且难以记忆。 为什么过了这么久才发现 across()?

2.4K10

R语言之 dplyr

dplyr 包里处理数据框的所有函数的第一个参数都是数据框名。 下面以 MASS 包里的 birthwt 数据集为例,介绍 dplyr 包里常用函数的用法。...使用 group_by( ) 拆分数据框 函数 group_by( ) 可以将数据框按照某一个或某几个分类变量拆分成多个数据框。...group_by( ) 不会改变数据框的外观,而会改变它与其他 dplyr 动词函数的作用方式 。...相对于传统的数据框,tibble 很多方面具有优势,感兴趣的读者可以参阅函数 tibble( ) 的帮助文档。...很多情况下,比如在上面的示例,这些中间变量其实是没有什么实际意义的。我们需要给这些中间变量命名,而且这些中间变量会保存在工作空间中占用内存。

39020

dpois函数_frequency函数

dplyrgroup_by()和summarize()是同时使用最常用的工具之一:分组概括。...幸运的是,所有聚合函数都有一个na.rm参数,该参数计算之前删除缺失值: flights %>% group_by(year, month, day) %>% summarise(mean...我们将保存此数据集,以便我们可以接下来的几个示例重复使用它。 not_cancelled % filter(!is.na(dep_delay), !...查看此类图时,过滤掉具有最少观察数的组通常很有用,因此可以看到更多的模式,而不是最小组的极端变化。这就是下面的代码所做的,并向您展示了将ggplot2集成到dplyr的便捷模式。...过滤提供所有变量,每个观察一个单独的行: not_cancelled %>% group_by(year, month, day) %>% mutate(r = min_rank(desc

1.8K10

数据清洗与管理之dplyr、tidyr

通过变量名引用(多用于二维数组):数据集$变量名 > head(iris$Petal.Length,5) [1] 1.4 1.4 1.3 1.5 1.4 1 创建新变量 R语言中,可以通过变量计算/.../缺失值行 删除缺失值行:na.omit() > df <- matrix(c(1:5,NA,7:10),nrow=5) > df [,1] [,2] [1,] 1 NA [2,]..." 5 dplyr包的下述五个函数用法【高级数据管理包】 # install.packages("dplyr") library(dplyr) #使用datasets包的mtcars数据集做演示,首先将过长的数据整理成友好的...summarise(mtcars_df,mdisp = mean(disp, na.rm = TRUE)) 5.6 分组: group_by() %>% 是管道函数,将左侧数据结果传递到右侧,作为右侧处理的原始数据...key #value:将原数据框的所有值赋给一个新变量value #…:可以指定哪些列聚到同一列 #na.rm:是否删除缺失值 widedata <- data.frame(person=c('Alex

1.8K40

tidyverse:R语言中相当于pythonpandas+matplotlib的存在

——将左侧的值应用到右侧数据data位置 管道函数tidyverse,管道符号是数据整理的主力,可以把许多功能连在一起,而且简洁好看,比起R的基本代码更加容易阅读!...4.6 分组: group_by # install.packages("dplyr") library(dplyr) 4.1 筛选: filter() #按给定的逻辑判断筛选出符合要求的子数据集...summarise(mtcars_df,mdisp = mean(disp, na.rm = TRUE)) 4.6 分组: group_by() #当对数据集通过group_by()添加了分组信息后,...这些函数允许长数据格式(long data)和宽数据格式(wide data)之间进行转换(功能类似于reshape包,但是比reshape更好用,并且可以用于管道%>%连接)。...= FALSE) #data:需要被转换的宽形表 #key:将原数据框的所有列赋给一个新变量key #value:将原数据框的所有值赋给一个新变量value #…:可以指定哪些列聚到同一列 #na.rm

3.9K10

教你几招R语言中的聚合操作

前言 ---- 在数据处理和分析过程,可能会涉及到数据的聚合操作(可理解为统计汇总),如计算门店每天的营业总额、计算各地区的二手房的平均价格、统计每个消费者近半年内最后一笔交易时间等。...R语言中提供了几种实现数据聚合的常用函数,它们分别是基于stats包的aggregate函数、基于sqldf包的sqldf函数以及基于dplyrgroup_by函数和summarize函数。...基于group_by和summarize函数的聚合 ---- 结合dplyrgroup_by函数和summarize函数实现数据的分组聚合可以避开aggregate函数和sqldf函数的一些缺点,...其中group_by函数用于指定分组变量,summarize函数用于指定具体的聚合过程,关于这两个函数的用法及参数含义如下: group_by(.data, ..., add = FALSE) .data...:指定数据库的哪些变量需要用作分组变量; add:bool类型的参数,是否已分组的数据框上再添加group_by的分组设置,默认为FALSE;summarise(.data, ...) .data:

3.3K20

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券