首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

包 #dplyr中基本函数 filter——数据筛选(筛选观测,行) filter(Hdma_dat,pclass == 1) ###################################...二、数据分组以及分组汇总 1、cut函数 b<- cut(a, 5,labels=F) #将数据平均分成5组,rank=5代表大,rank=1代表小 2、aggregate函数——分组汇总 ?...在base包里和split功能接近的函数有cut(对属性数据分划),strsplit(对字符串分划)以及subset(对向量,矩阵或数据框给定条件取子集)等。...##对于数据框 x是对象,subset是保留元素或者行列的逻辑表达式,对于缺失用NA代替。 Select 是选取的范围,应小于x。...最让我在意的是分组汇总这块内容: mygroup= group_by(data,gender,ID) from_dplyr<-summarize(mygroup,mean=mean(mortgage))

20.5K32

Day6-学习R包

R包是多个函数的集合,编码和样本数据的集合,或者通俗讲,R包相当于R的插件(有可能不准确)存放位置:名为”library“的目录下必要性:丰富的图表和Biocductor上面的各种生信分析需要R包以dplyr...")加载library(dplyr)指定数据test <- iris[c(1:2,51:52,101:102),]dplyr五个基础函数新增列,mutate(test, new = Sepal.Length...* Sepal.Width)列筛选,select(test,c(1,5))或者select(test, Petal.Length, Petal.Width)筛选行,filter(test, Species...== "setosa")某1列或某几列对整个表格进行排序,arrange(test, Sepal.Length)汇总,对数据进行汇总操作,summarise(test, mean(Sepal.Length...), sd(Sepal.Length))dplyr的两个技能管道操作,相当于linux的管道符|count统计某列的uniquecount(test,Species)dplyr处理关系数据内连取交集,

12830

学习小组DAY6-Creep

今天的学习内容是R包,R包是多个函数的集合,本次主要是学习dplyr包。安装和加载R包设置镜像每次下载R包时,都需要重新配置镜像。...之前已经安装过dplyr包了,所以直接加载即可加载library(包)和require(包)均可实现加载的目的。...五个基础函数mutate(),新增列select(),列筛选filter()筛选行arrange(),某1列或某几列对整个表格进行排序summarise():汇总进行汇总时可以结合group_by,...实用性更强dplyr两个实用技能管道操作 %>% (cmd/ctr + shift + M)管道操作可以直接省略中间步骤,导出最后的结果count统计某列的uniquedplyr处理关系数据将2个表进行连接...其实就是以左边那个表格作为连接的依据找到对应的,如果没有就以NA表示全连full_join半连接:返回能够与y表匹配的x表所有记录semi_join反连接:返回无法与y表匹配的x表的所记录anti_join

14880
领券