首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

R语言︱数据分组、筛选(plit – apply – combine模式、dplyr、data.table)

R语言︱数据分组 大型数据通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较。...:对每个小片断独立进行操作; combine:把片断重新组合。...可见order用法 subset()在数据集中非常好用,which是针对较小的数据筛选,比较低纬度的数据筛选时候可以用的。 subset=which+数据操作 which=order+多变量运行。...在使用data.table时候,需要预先布置一下环境: data<-data.table(data) 如果不布置环境,很多内容用不了。...data.table包提供了一个非常简洁的通用格式:DT[i,j,by],可以理解为:对于数据DT,选取子集行i,通过by分组计算j。

20.5K32

数据处理|R-dplyr

1)安装、加载dplyr包、准备数据 install.packages("dplyr") #加载dplyr使用dplyr包处理数据前,建议先将数据转换为tbl对象。...data(iris) #本文使用iris示例数据。 2)数据记录筛选(行筛选) filter函数:按指定条件筛选符合条件中逻辑判断要求的数据记录。...>%, 使用时把数据名作为开头, 然后依次对此数据进行多步操作。...sample_n(mtcars, 50, replace = TRUE) #随机有重复的取50行数 10)数据联结 dplyr包也提供了数据的连接操作,如左连接、右连接、内连接等: inner_join...(x,y,by = NULL) #内连接,合并数据仅保留匹配的记录 by设置两个数据用于匹配的字段名,默认使用全部同名字段进行匹配,如果两个数据需要匹配的字段名不同,可以直接用等号指定匹配的字段名

1.9K10

组合数学】生成函数 ( 使用生成函数求解多重 r 组合数 )

文章目录 一、使用生成函数求解多重 r 组合数 二、使用生成函数求解多重 r 组合数 示例 参考博客 : 【组合数学】生成函数 简要介绍 ( 生成函数定义 | 牛顿二项式系数 | 常用的生成函数 |...) 【组合数学】生成函数 ( 生成函数应用场景 | 使用生成函数求解递推方程 ) 一、使用生成函数求解多重 r 组合数 ---- S = \{ n_1 \cdot a_1, n_2 \cdot a_...r 组合数是 C(k + r - 1, r) 回顾多重排列组合 : 可重复的元素 , 有序的选取 , 对应 多重的排列 ; 全排列 = \cfrac{n!}..., 非全排列 k^r , \ \ r\leq n_i 可重复的元素 , 无序的选取 , 对应 多重组合 ; N= C(k + r - 1, r) 上述的 多重 r 组合数 C(k + r...r 组合数 示例 ---- 多重 S = \{3\cdot a , 4 \cdot b , 5 \cdot c \} , 求该多重的 10 组合数 ; 上述多重元素的 重复度 3,4,5

95700

数据 | 共享单车使用数据

下载数据请登录爱数科(www.idatascience.cn) 自行车共享系统是传统自行车的新一代租赁方式,从会员资格,租赁和返还的整个过程已实现自动化。...除了自行车共享系统在现实世界中的有趣应用之外,这些系统生成的数据的特性使它们对研究具有吸引力。与其他运输服务(例如公共汽车或地铁)相反,在这些系统中明确记录了旅行的持续时间,出发和到达的位置。...因此,期望通过监视这些数据可以检测到城市中的大多数重要事件。...数据集中包括了美国共享单车公司Capital Bikeshare在华盛顿地区2011年和2012年的使用量历史记录,以及每天对应的天气信息。 1. 字段描述 2. 数据预览 3....数据来源 http://capitalbikeshare.com/system-data 5.

1.5K20

「R」数据操作(五):dplyr 介绍与数据过滤

在对数据进行可视化之前我们往往需要进行数据转换以得到可视化所需要的数据内容与格式。这里我们使用dplyr包操作2013年纽约市的航班起飞数据(2013)。...准备 这部分我们聚焦于如何使用dplyr包,除ggplot2的另一个tidyverse核心成员。我们将使用nyclights13数据包解释关键的概念并使用ggplot2帮助理解数据。...nycflights13 我们将使用nycflights13::flights来探索dplyr包基本的数据操作动词。该数据包含2013年336,776次航班起飞数据,来自美国交通统计局。...,这里适配地显示了在一个屏幕前几行和所有的列(我们可以使用View(flights)在Rstudio中查看数据的所有信息。...使用filter()过滤行 filter()允许我们根据观测值来对数据取子集。第一个参数是数据框的名字,第二和随后的参数是用于过滤数据框的表达式。

2.4K11
领券