前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R海拾遗--data.table初级学习

R海拾遗--data.table初级学习

作者头像
火星娃统计
发布2020-09-15 12:26:14
7490
发布2020-09-15 12:26:14
举报
文章被收录于专栏:火星娃统计火星娃统计

data.table初级学习

概述

data.table对于大数据的数据整理较为便捷,很多的时候比data.frame效率更高,一般情况下结合管道符号进行计算

管道符

  • %in% 表示包含
  • %>% 表示向右传递
  • %$% 表示向右传递并直接按列操作

安装

代码语言:javascript
复制
install.packages("data.table")
install.packages("magrittr")
library(magrittr)
library(data.table)

使用方法

  • 简单操作
代码语言:javascript
复制
iris<-iris %>% 
  as.data.table()

class(iris)
# 行数
nrow(iris)
# 列数
ncol(iris)
# 列名
names(iris)
# 选取列
iris[ , Species] # 返回一组向量
iris[ , .(Species)] #返回一个data.table
iris[, c("Species"), with=FALSE] #返回一组数据框
# 保留多列
iris[, .(Sepal.Length, Sepal.Width, Species)]
# 对变量进行重命名
setnames(iris, c("Species"), c("new_Species"))
# 对多个变量进行重命名
# 第一个c()对应原始变量名
# 第二个c()对应新变量名
setnames(iris, c("Species","Petal.Width"), c("new_Species","new_Petal.Width"))
# 子集的筛选与过滤
iris[Species == "setosa"]
# 设置索引提升效率
# setkey()函数可以在数据集上设置键值。置好key后,data.table会将数据按照key来排序
setkey(iris, Species)
iris[c("setosa", "virginica")]

结束语

来不及解释,时间来不及了,今天就简单这样吧,总体来说,data.table比data.frame更加简洁,运行更加迅速。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 火星娃统计 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • data.table初级学习
    • 概述
      • 管道符
        • 使用方法
          • 结束语
          相关产品与服务
          大数据
          全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档