首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

《高效R语言编程》6--高效数据木匠

这是本书最重要一章,将涉及以下内容: 使用tidyr整理数据 使用dplyr处理数据 使用数据库 使用data.table处理数据 软件配置 library("tibble") library("tidyr...用法是:gather(data,key,value,-religion),分别是数据框,要转换成分类列名,单元值列名和清除收集变量 使用seperate()分割联合变量 分割是指将一个实际由两个变量组成变量分割成两个独立列...使用dplyr高效处理数据 这个包名意思是数据框钳,相比基础R优点是运行更快、与整洁数据和数据库配合好。函数名部分灵感来自SQL。 ?...列改名 rename(),使用反引号‘`’包裹,允许R使用不规范列名。...数据库与dplyr 必须使用src_*()函数创建一个数据源。# 使用data.table()处理数据 是dplyr替代,两个哪个好存在争议,最好学一个一直坚持下去。

1.9K20
您找到你想要的搜索结果了吗?
是的
没有找到

R数据科学整洁之道:使用 tibble 实现简单数据框

既生 data.frame,何生 tibbletibble 是一种简单数据框,它对传统数据框功能进行了一些修改,其所提供简单数据框更易于在 tidyverse 中使用。...tidyverse 中许多函数都可以创建 tibble,因为 tibble 是 tidyverse 标准功能之一。 可以通过 tibble() 函数使用一个向量创建tibble。...可以在 tibble使用R 中无效变量名称(即不符合语法名称)作为列名称。例如, 列名称可以不以字母开头,也可以包含特殊字符(如空格)。...ggplot2 和 dplyr 等其他 R 包中使用这些变量,也需要使用反引号。...创建 tibble 另一种方法是使用 tribble() 函数,tribble 是 transposed tibble(转置 tibble缩写。

1.7K10

R编程(二:基本数据类型及其操作之因子、矩阵、数据框和列表)

rownames(df), colnames(df),返回行名与列名。 构建data frame 本质就是不同类型向量排列组合。 首先构建vectors。...类型类属依次为tbl_df, tbl, data.frame,用as_tibble()可以将一个数据框转换为tibble,或者直接通过tibble创建数据框般创建tibble 数据框: t.bp...R 会为每个独立向量分配一个整数,创建一个value-label 对,value 对应向量元素,label 对应分配数字。...R lists 一个R列表包括了各种类型变量,并将他们放置在同一个列表当中,这些变量可以是矩阵、向量、数据集,甚至是其他列表。...test2 <- read.csv("excise.csv") # 3.使用函数,查看test2列名。 colnames(test2) # 4.使用函数,查看test2行数和列数。

2.8K20

R语言基础-数据清洗函数pivot_longer

names_to:一个字符向量,指定要根据存储在 cols 指定数据列名信息创建一个或多个新列。如果长度为 0,或者如果提供了 NULL,则不会创建任何列。...如果长度为 1,将创建一个包含 cols 指定列名列。如果长度>1,将创建多个列。在这种情况下,必须提供 names_sep 或 names_pattern 之一来指定如何拆分列名。...如果这些参数没有给您足够控制权,请使用 pivot_longer_spec() 创建一个规范对象并根据需要手动处理。...names_ptypes, values_ptypes:(可选)列名-原型对列表。或者,可以提供一个原型,它将应用于所有列。...原型(或简称 ptype)是一个零长度向量(如 integer() 或 numeric()),它定义了向量类型、类和属性。如果您想确认创建列是您期望类型,请使用这些参数。

6.6K30

R」ggplot2在R包开发中使用

你用字符串向量来表示列名。 由用户指定列名和表达式,而你想要你函数能够有aes()同样方式执行非标准计算。...如果你已经像上面的例子一样事先知道了列名,你可以使用来自rlang[2]代词.data指代你要使用图层数据。...geom_bar(aes(x = .data$drv)) + coord_flip() } 如果你列名是字符串向量(例如, col = "drv"),使用 .data[[col]]...对于上面的例子,函数可能是这样: discrete_distr_data <- function(x) { tibble::tibble( value = names(x), probability...不应该停止你创建自己函数可视化对象! 创建一个新主题 当创建一个新主题时,从已有主题出发总是好实践(例如,theme_grey()),然后使用%+replace%替换需要该包元素。

6.6K30

tidyverse:R语言中相当于python中pandas+matplotlib存在

出版有《R for Data Science》(中文版《R数据科学》),这本书详细介绍了tidyverse使用方法。...02 — tibble:高级数据框(data.frame升级版) ——数据(列)类型一目了然 tibbleR语言中一个用来替换data.frame类型扩展数据框,tibble继承了data.frame...,是弱类型,同时与data.frame有相同语法,使用起来更方便。...tibbledata.frame做了重新设定: tibble,不关心输入类型,可存储任意类型,包括list类型 tibble,没有行名设置 row.names tibble,支持任意列名 tibble...”, fill = “warn”, …) #data:为数据框 #col:需要被拆分列 #into:新建列名,为字符串向量 #sep:被拆分列分隔符 #remove:是否删除被分割列 widesep

4K10

R使用gt包创建表格入门

其他包含注释、表格元素风格以及文本转换特征用于更好更清楚地表达主题。 使用简单表格展示gt基础 让我们使用一个R datasets包中不是很流行数据集islands:它是一个命名向量。...我们使用dplyr根据它准备一个tibble: # 获取世界10个最大大陆 islands_tbl <- dplyr::tibble( name = names(islands),...它们每一个都可以(1)提供一个行名或列名向量(2)1个行索引/列索引向量(3)包含在vars()函数中列名(4)选择帮助函数starts_with()、ends_with()、contains(...针对行,我们可以使用列名为变量条件语句(例如size > 15000)。 这里有一个如何添加脚注简单例子。...R. (1977) *Interactive Data Analysis*.

4.5K21

基因表达差异分析前准备工作

回顾 单细胞RNA-seq分析介绍 单细胞RNA-seq设计和方法 从原始数据到计数矩阵 学习目标 了解R言语使用各种数据类型和数据结构 在R使用函数并了解如何获取有关参数帮助 使用dplyr包中管道...(%>%) 了解ggplot2用于绘图语法 配置 创建一个新项目目录 创建一个名为R_refresher项目 创建一个名为reviewing_R.R 项目目录中创建data和figures文件夹...1library(tidyverse) 2counts <- read.csv("data/raw_counts_mouseKO.txt") 3class(counts) 4str(counts) 创建向量...>%创建meta对象tibble 并将其命名为meta_tb(确保不会丢失行名!)...让我们创建一个包含count和metadata数据列表,为后续分析做准备。 使用meta和count对象创建名为project1列表,并从两个数据框之一中提取所有样本名称创建一个新向量

1.1K20

R使用gt包创建表格

另外,该包作者将表格相关包做了个汇总,我也把它更新到了本文下方。本文应当可以成为读者使用 R 构建表格一大入口,值得点赞收藏。 RStudio 提供了出版级表格解决方案gt包。...使用简单表格展示gt基础 让我们使用一个R datasets包中不是很流行数据集islands:它是一个命名向量。...我们使用dplyr根据它准备一个tibble: # 获取世界10个最大大陆 islands_tbl <- dplyr::tibble( name = names(islands),...它们每一个都可以(1)提供一个行名或列名向量(2)1个行索引/列索引向量(3)包含在vars()函数中列名(4)选择帮助函数starts_with()、ends_with()、contains(...针对行,我们可以使用列名为变量条件语句(例如size > 15000)。 这里有一个如何添加脚注简单例子。

2.7K10

R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

参考:李东风老师R 语言实战 1. tidyverse 系统简介 假设数据以 tibble 格式保存。...按列号 select(test,1) select(test,c(1,5)) 按列名 如果想要用向量来存放希望筛选列名,需要使用函数 one_of 来存放该向量。...对于待分离对象(col),不必加上引号;但对于即将创建新列(into),需要使用引号,由于是两列,这里使用向量创建。sep参数设定读取表格信息时以何符号作为分隔符。...对于即将合并新列,需要使用引号;但对于想要合并多个列名,可以不用使用引号。sep 参数设定多列合并后不同数据分隔使用分割符。...R 数据整理(六:根据分类新增列种种方法 1.0) 其他函数 slice dplyr 包函数 slice(.data, ...) 可以用来选择指定序号行子集,正序号表示保留,负序号表示排除。

10.8K30

玩转数据处理120题|R语言版本

R语言解法 # R中没有字典概念,故直接创建dataframe/tibble #> 第一种 df <- data.frame( "grammer" = c("Python","C","Java","...df %>% tibble::column_to_rownames('createTime') 42 数据创建 题目:生成一个和df长度相同随机数dataframe 难度:⭐⭐ R解法 df1...R解法 df %>% ggplot(aes(`涨跌幅(%)`)) + geom_histogram(bins=30) 61 数据创建 题目:以data列名创建一个dataframe 难度:⭐⭐...0, 99, 5)") 84 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个指定分布(如标准正态分布)R语言解法 df3 <- as.data.frame...R语言解法 tibble(data = str_glue('{round(df$data * 100,2)}%')) 106 数据查找 题目:查找上一题数据中第3大值行号 难度:⭐⭐⭐ R语言解法

8.7K10

R︱Rstudio 1.0版本尝鲜(R notebook、下载链接、sparkR、代码时间测试profile)

但是另外一台电脑在低版本R中,3.1好像需要加装tibble 1.0,并且尝试了还是用不来,报错: tibble1.1 is required but 1.0 is available 会让你check...RStudio现在集成支持Spark和sparklyr包,主要工具如下: 1.创建和管理Spark连接 2.浏览表和Spark数据框列 3.预览Spark数据框前1000行 一旦安装好sparklyr...这个面板包括一个新连接,可以用于本地或者远程spark实例连接。 ? 连接成功后,你可以看淡Spark集群中数据表。 ? 使用RStudio浏览Spark数据框中数据。 ?...分析结果还有个Data页,点开来是个调用树,展示了各个函数调用花费情况(仍然是内存及时间)。...但是有些字段明明是数字却被显示成了字符串,可以直接在列名下拉框里进行修正。(来源公众号:子豹)

1K50

R」数据操作(五):dplyr 介绍与数据过滤

该部分学习内容来自R for Data Science》。 在对数据进行可视化之前我们往往需要进行数据转换以得到可视化所需要数据内容与格式。...nycflights13 我们将使用nycflights13::flights来探索dplyr包基本数据操作动词。该数据集包含2013年336,776次航班起飞数据,来自美国交通统计局。...输出显示不同原因是这个数据集是一个Tibble。Tibbles都是数据框data.frame,但经过改良以便于更好(在tidyverse生态中)工作。...你可能已经注意到每个列名下面有三到四个字母缩写。...它们描述了每个变量类型: int代表整数 dbl代表浮点数或者实数 chr代表字符向量或者字符串 dttm代表日期-时间 还有其他三种数据类型在本部分不会使用到,但后续我们会接触: lgl代表逻辑向量

2.5K11

R入门?从Tidyverse学起!

同时也出了一本《R for Data Science》,这本书里面也详细介绍了tidyverse使用方法,这本书电子版获取方式见本文末尾。...数据操作速度会更快 如下图,直接查看tibble格式数据,可以一目了然看清数据大小和每列格式 ? 有两种方式来创建tibble格式数据 1. 直接创建 ? 2....其他格式转化,例如用read.csv读取数据默认是dataframe格式,就可以使用as_tibble转换为tibble格式 ?...总结 初学者从tidyverse 入门是一个不错使用R切入方式,它提供了一整套data science工具,而且还特别好用。...当然,入门之后如果使用者在未来需要使用R完成更细腻分析时,再分配较充足时间学习base R

2.6K30
领券