前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基础知识 | R语言数据分析之表格处理

基础知识 | R语言数据分析之表格处理

作者头像
黑妹的小屋
发布2020-08-06 14:59:21
2.6K0
发布2020-08-06 14:59:21
举报

R语言处理数据

在R中很多内置函数,用于数据框的基本操作,比如转换、分组、排序、拼接等,常见的函数有rbind(),cbind(),dplyr(),tidyr(),reshape2,tidyverse(),base()等,其中,base()是R语言内置包,无需安装。数据处理是ggplot2绘图的基础,同时也是R语言中花费时间较多的工作之一,提高数据处理的效率能够很快的得到可靠美观的图片。

01

表格拼接

#构建数据框

#给数据框df18添加行或纵向添加表格

>dr1<-rbind(df18,df20)

#给数据框df18添加列或横向添加表格

>dc1<-cbind(df18,df19)

运行结果如下:

02

表格融合

有时候,表格之间没有很好的保持一致,仅仅依靠rbind() 和cbind()函数直接拼接无法实现,当两个表之间有共同的列时,能够进行表格的融合,可以采用merge()函数。merge()函数,合并数据框中的x和y的列名的向量,如果有些数据框y列名中没有数据,也会默认为是匹配x列名的数据。

#构建数据框

>dm1<-merge(df1,df2,by="x",all=TRUE)#by是合并x和y共享列名中的向量,默认为两个表之间有共享的键列。如果y没有键列,则默认为x的键。all=TRUE是x=TRUE,y=TRUE的简写

>dm2<-merge(df1,df3,by.x="x",by.y="f")#by.x与by.y是分别指左边数据框的匹配列,右边数据框的匹配列

>dm3<-merge(df1,df4,by=c("x","y"),all=TRUE)

03

表格分组

#构建数据

#df5的变量名称country,GDP2019,GDP2018储存的向量应为数值,不能含有中文,否则melt运行失败。

#df_m按照year分组

#同时按照year和country两个变量分组操作

#只有根据country分组求year和value的均值

04

表格排序

#将df_m数据框进行排序

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 菜鸟学数据分析之R语言 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档