首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言基础-数据清洗函数pivot_longer

names_to:一个字符向量,指定要根据存储在 cols 指定数据列名信息创建一个或多个新。如果长度为 0,或者如果提供了 NULL,则不会创建任何。...如果长度为 1,将创建一个包含 cols 指定列名。如果长度>1,将创建多个。在这种情况下,必须提供 names_sep 或 names_pattern 之一来指定如何拆分列名。...names_sep 采用与单独()相同规范,可以是数字向量(指定要中断位置),也可以是单个字符串(指定要拆分正则表达式)。...原型(或简称 ptype)是一个零长度向量 integer() 或 numeric()),它定义了向量类型、类和属性。如果您想确认创建是您期望类型,请使用这些参数。...请注意,如果要更改(而不是确认)特定类型,则应改用 names_transform 或 values_transform。

6.5K30

数据处理第2节:将转换为正确形状

转换:基础部分 您可以使用mutate()函数创建新。 mutate选项几乎是无穷无尽:你可以对普通向量做任何事情,可以在mutate()函数内完成。...mutate任何内容都可以是新(通过赋予mutate新列名),或者可以替换当前列(通过保持相同列名)。 最简单选项之一是基于其他计算。...如果要添加另一个数据框信息,可以使用dplyr连接函数。...连接本身就是一个章节,但在这种特殊情况下你会做一个left_join(),即保持我主表(在左边),并从另一个向右添加。 在by =语句中,您指定哪些相同,因此连接知道要添加位置。...在前面的示例,新“sleep_measure”是一个字符向量。 如果您要进行总结或后续绘制,则该将按字母顺序排序。

8.1K30
您找到你想要的搜索结果了吗?
是的
没有找到

R数据科学整洁之道:使用 tibble 实现简单数据框

多数情况下,我们会交替使用 tibble 和数据框这两个术语。 安装 tibble 包是 tidyverse 核心包之一,因此安装 tidyverse 就可以了。...tidyverse 许多函数都可以创建 tibble,因为 tibble 是 tidyverse 标准功能之一。 可以通过 tibble() 函数使用一个向量来创建新 tibble。...tibble() 会自动重复长度为 1 输 入,并可以使用刚刚创建新变量,如下所示: library(tidyverse) tibble( x = 1:5, y = 1, z = x ^ 2...可以在 tibble 中使用在 R 无效变量名称(即不符合语法名称)作为列名称。例如, 列名称可以不以字母开头,也可以包含特殊字符(空格)。...tribble() 是定制化,可以对数据按行进行编码:标题由公式(以 ~ 开头) 定义,数据条目以逗号分隔,这样就可以易读方式对少量数据进行布局: tribble( ~x, ~y, ~z,

1.6K10

16. R编程(二:基本数据类型及其操作之因子、矩阵、数据框和列表)

找出所有带有rings planet。空着或行就表示全选。...<- tibble( `序号`=c(1,5,6,9,10,15), `收缩压`=c(145, 110, "未测", 150, "拒绝", 115)) t.bp 我们可以对数据框相同操作来处理...动物种类:猴子,兔子,老鼠。不同动物之间不存在高低顺序关联性。2)An ordinal variable,表示有一个排序关系。描述程度关系词:高,,低。明显有一个内在关系。...列表提取也可以按照类似数据框方式提取。、 需要注意是,列表一个括号提取内容,会返回一个列表,列表包含提取内容,只有用两个中括号,才会返回该内容本来格式。...shining_list[3] # 第三个变量 2)检索list变量名获取。

2.8K20

R数据科学|3.4内容介绍及习题解答

3.4 使用select()选择 通过基于变量名操作,select()函数可以让你生成一个有用变量子集。...select(flights, year, month, day, year, year) 这种机制非常有用,因为它意味着我们可以使用select()和everything()来轻松地更改顺序,...vars <- c( "year", "month", "day", "dep_delay", "arr_delay" ) 解答 one_of()函数作用是:选择带有字符向量变量,而不是不带引号变量名参数...这个函数很有用,因为通过编程生成带有变量名字符向量比生成不带引号变量名更容易,后者更容易键入。...如果其中一个变量名不存在all_of()函数将报错,而any_of()将忽略它。如果遇到未知,one_of()将发出警告。 问题四 以下代码运行结果是否出乎意料?

1.6K60

R 数据整理(十一: purrr包实现更花样匿名函数使用)

1. map 族 其实map 除了对向量有用,也可以作用于数据框或矩阵类型,相当于把其中每一作为一个单独元素来看,有点像按apply: > map(infos, typeof) $family...将无名函数写成“~ 表达式”格式, 表达式就是无名函数定义, .表示只有一个自变量时变量名.x和.y表示只有两个自变量时变量名..1、..2、..3这样名字表示有多个自变量时变量名...除此之外,map 还有其他变种: modify(),输入一个数据自变量和一个函数, 输出与输入数据同类型结果; map2()可以输入两个数据自变量和一个函数, 将两个自变量相同下标的元素函数进行变换..., 输出列表; imap()根据一个下标遍历; walk()输入一个数据自变量和一个函数, 返回任何结果,仅利用输入函数副作用; 输入若干个数据自变量和一个函数, 对数据自变量相同下标的元素函数进行变换...其他有用函数 比如keep, 可以专门用来选择数据框各或列表元素满足某种条件子集, 这个条件一个返回逻辑值函数来给出。

2.4K30

2023.4生信马拉松day7-R语言综合应用

) library(tibble) 专题1 玩转字符串★★★ stringr包含几十个函数,本节课主要讲以下6个: 图片 1. str_length() 检测字符串长度 str_length()数是引号里面有多少个字母...-(2)多次嵌套避免中间变量直观,且容易出错; ——设置彩虹括号,可以在多层嵌套时看清楚哪个括号和哪个括号是一对: options -- code -- display --use rainbow...str_detect()可以检测样本是不是含有某个字符,然后返回逻辑值,ifelse()对逻辑值T/F进行替换 samples = c("tumor1","tumor2","tumor3","normal1...转换数据:把表格转换成两数据 -(1) 第一步:转置 -(2) 第二步:把行名作为一添加到数据(因为ggplot2容易把行名丢掉,所以倾向于把行名作为一) -(3) 第三步:新增一“group...如何挑出30个数里最大五个 -(1)排序 -(2)取最后五个 图片 3.向量/列表隐式循环-lapply() 对列表/向量每个元素实施相同操作 lapply(1:4,rnorm) #批量画图

3.6K80

R数据科学|3.5内容介绍及习题解答

上节我们对选择现有的进行了介绍与习题解答,现在对数据框添加新进行介绍,这里使用mutate()函数,注意:mutate()总是将新添加在数据集最后。...下面介绍一些比较常用创建函数: 算术运算符:+、-、*、/、^ 它们都是向量,使用所谓“循环法则”。如果一个参数比另一个参数短,那么前 者会自动扩展到同样长度。...其他条件相同情况下,更推荐使用log2()函数,因为很容易对其进行解释:对数标度数值增加 1 个单位,意味着初始数值加倍;减少 1 个单位,则意味着初始数值减半。...= 如果需要进行一系列复杂逻辑运算,那么最好将中间结果保存在新变量,这样就可 以检查是否每一步都符合预期。 排秩 min_rank()可以完成最常用排秩任务(第一、第二、第三、第四)。...,R会将较短向量值,生成与较长向量相同长度向量

2.5K50

35. R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

指定变量名时不是写成字符串形式而是直接写变量名: d.class %>% distinct(sex, age) %>% knitr::kable() 如果希望保留数据框其它,可以加选项 keep_all...按号 select(test,1) select(test,c(1,5)) 按列名 如果想要用向量来存放希望筛选列名,需要使用函数 one_of 来存放该向量。...,向号一样切片操作: d.class %>% select(age:weight) %>% head(n=3) %>% knitr::kable() 参数前面写负号表示扣除,: d.class...nest 和 unnest 函数,可以将子数据框保存在 tibble ,可以将保存在 tibble 子数据框合并为一个大数据 框。...实际上,tibble 允许存在数据类型是列表 (list) ,子数据框就是以列表数据类型保存在 tibble

10.8K30

R语言入门系列之一

向量可以使用执行组合函数c()来创建向量,其数据来源可以是数值型、字符型、逻辑型数据(单个向量其数据类型必须相同),也可以来自标量,其参数可以是变量名,具体如下所示: 连续整数可以使用“:”来表示也即...此外还有grepl()返回匹配逻辑值、sub()替换、gsub()全局替换等length()返回对象长度也即元素个数mode()查看对象数据类型(也即数值型、字符型等)names()返回向量元素名字order...a, b)求两个向量并集intersect()求两个向量交集setdiff()setdiff(a, b)求在a而不在b部分setequal()setequal(a, b)检验ab是否完全相同...数据框元素索引有三种方法,第一种为通过序号索引,第二种通过列名字索引,第三种通过$变量名索引,如下所示: 可以使用attach()函数来将数据框添加到当前平台,这样就可以直接使用列名字或变量名来调用数据框数据...一般情况下,我们把文件都复制到工作路径方便引用,查询当前路径使用getwd(),更改路径使用setwd(),如下所示: 除了read.table()外,还有专门读取逗号分隔csv文件read.csv

3.8K30

R数据科学|第七章内容介绍

通过tibble()函数使用一个向量来创建新 tibbletibble() 会自动重复长度为 1 输入,并可以使用刚刚创建新变量。...1 2 #> 2 2 1 5 #> 3 3 1 10 #> 4 4 1 17 #> 5 5 1 26 可以在 tibble 中使用在 R 不符合语法名称作为列名称。...例如,列名称可以不以字母开头,也可以包含特殊字符(空格)。要想引用这样变量,需要使用反引号将它们括起来。...(以 ~ 开头)定义,数据条目以逗号分隔,这样就可以易读方式对少量数据进行布局。...取子集 提取方式相同,但tibble 更严格:它不能进行部分匹配,如果想要访问不存在,它会生成一条警告信息。 [[ 可以按名称或位置提取变量;$ 只能按名称提取变量。

1K30

《高效R语言编程》6--高效数据木匠

将你数据整理好是一个可敬、某些情况下是至关重要技能,所以作者使用了数据木匠这个词。...tibble会打印每个变量类,data.frame不会 stringAsFactors默认转换 输出时,只输出前10行 使用tidyr与正则表达式整理数据 整理数据包括数据清理和数据重构,前者是重定格式与标记脏数据...正则表达式 R与stringr分别使用grepl()和str_detect()来进行,我比较喜欢基础R,不知你喜欢安装包还是基本。...unlist()函数作用,就是将list结构数据,变成非list数据,即将list数据变成字符串向量或者数字向量形式。...RODBC是一个资深包,提供R与SQL server接口。DBI包提供了通用接口与驱动程序类集,RSQLITE,是访问数据库统一框架,允许其他驱动程序以模块包添加。

1.9K20

基于 mlr 包逻辑回归算法介绍与实践(上)

2.2.3 特征选择(feature selection) 这是另一个非常重要机器学习任务:保留增加预测价值变量,删除没有增加预测价值变量。...female 14 30.1 1 # ... with 881 more rows 2.3 绘制数据 首先,使用 gather() 函数将数据转化为 untidy 形式:每个预测变量名保存在一...,它们值保存在另一。...当缺失值情况与完整情况比例非常小时,第一种选择可能是有效。在这种情况下,省略带有缺失值实例不太可能对模型性能产生很大影响。...第二种选择是使用一些算法来估计那些缺失值,这些估计值替换 NA,并使用这个新数据集来训练模型。估计缺失值方法有很多种,例如均值插补,也就是取缺失数据变量均值,用它来替换缺失值。

2.2K20

「R」purrr实现迭代

,因此复制粘贴了col_mean(),并使用相应median()和sd()函数替换了mean()函数: col_median = function(df) { output = vector(...哎呀,我们又复制粘贴了2次代码,因此是不是该思考下如何扩展一个代码让它同时发挥几个函数功能呢?这段代码大部分是一个for循环,而且如果仔细很难看出3个函数有什么差别。...)作为输入,并对向量每个元素应用一个函数,然后返回和输入向量同样长度一个新向量。...因为长度相同,所以将各个参数保存在一个数据框: params = tibble::tribble( ~mean, ~sd, ~n, 5, 1, 1, 10, 5, 3,...keep()和discard()函数可以分别保留输入预测值为TRUE和FALSE元素(在数据框中就是指): iris %>% keep(is.factor) %>% str()

4.8K20

FreeMarker与JSP 2.0 + JSTL组合进行比较

在某些应用程序,您可能希望显示不完整/损坏页面,而不是错误页面。在这种情况下,您可以使用另一个错误处理程序。...FreeMarker有关于变量名中使用字符,也不会就变量名长度没有限制,但为方便起见尽量选择可以简单变量引用表达式中使用变量名(看到这里)。...那么FreeMarker会知道你并不是相同符号表示运算符。这可以在您指定非引号标识符地方,宏和函数名称,参数名称以及所有类型变量引用。(请注意,这些转义仅适用于标识符,而不是字符串文字。)...16.如何在FreeMarker模板修改序列(列表)和哈希(映射)? 首先,您可能不想修改序列/散,只需连接(添加)两个或更多,这将导致新序列/散,而不是修改现有的序列/散。...这是因为您要打印字符不能用输出流使用字符集(编码)来表示,所以Java平台(而不是FreeMarker)问号替换有问题字符。

5.4K40

Day07 生信马拉松-数据整理R

(x," ")) x2 = str_split(x," ")[[1]];x2 #向量长度仅为1,因此[[1]] x2为字符型向量 ################################...(x2,"T") #判断x2T开头字符串,输出逻辑向量 str_ends(x2,"e") #判断x2e结尾字符串,输出逻辑向量 1.5 字符串替换 x2 str_replace(x2,"o",..., new = Sepal.Length * Sepal.Width) #R修改必须要赋值,赋值=没发生 test 2.4 连续步骤不同方法 2.4.1 多次赋值,产生多个中间变量 x1...} par(mfrow = c(2,2)) apply(iris[,1:4], 2, jimmy) 4.2 lapply(list, FUN, …)函数--参数与自定义函数相似 4.2.1 对列表/向量每个元素实施相同操作...### ggplot2 分面相关设置(facet)详解 7.一些实操便捷函数 7.1 match() 函数 load("matchtest.Rdata") x y ## 把y列名正确替换为x里面的

21800

R语言函数含义与用法,实现过程解读

同一个表达式向量并不需要具有相同长度。如果它们长度不同,表达式结果是一个与表达式中最长向量相同长度向量。...x==NA是一个与x具有相同长度而其所有元素都是NA向量。 NaN(Not a Number): 由数值运算产生,0/0, Inf-Inf.     ...如果参数包含数字的话,数字将被强制转化为字符串。在默认情况下,参数各字符串是被一个空格分隔,不过通过参数sep=string 用户可以把它更改为其他字符串,包括空字符串。...这种情况下一个由名称组成向量起到了和正整数索引向量相同效果。...包含两个元素x,y一个列表或一个两矩阵作为一个参数(第二种形式那样)也能达成相同效果。

4.6K120

R语言函数含义与用法,实现过程解读

同一个表达式向量并不需要具有相同长度。如果它们长度不同,表达式结果是一个与表达式中最长向量相同长度向量。...x==NA是一个与x具有相同长度而其所有元素都是NA向量。 NaN(Not a Number): 由数值运算产生,0/0, Inf-Inf.     ...如果参数包含数字的话,数字将被强制转化为字符串。在默认情况下,参数各字符串是被一个空格分隔,不过通过参数sep=string 用户可以把它更改为其他字符串,包括空字符串。...这种情况下一个由名称组成向量起到了和正整数索引向量相同效果。...包含两个元素x,y一个列表或一个两矩阵作为一个参数(第二种形式那样)也能达成相同效果。

5.6K30

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

复习R包stringr字符串操作几个函数-长度、拆分、提取、字符检测、替换和删除。...,代码运行凡是带有{}代码,均可以被折叠下载数据代码,保留但不反复运行,if(F){...},可以控制其运行但保留。...2.1.3 为什么Rdata而不是表格文件来衔接?变量,自带变量名称,不需要再次赋值,也没有参数。undefined表格文件需要赋值,读取参数不同导致读取结果不同,不能在后续代码同等处理。..., sum)#对test每一行求和向量/列表隐式循环-lapply,批量操作### 2.lapply(list, FUN, …) # 对列表/向量每个元素实施相同操作lapply(1:4,rnorm...7.5.3 箱线图应用单个基因在两组之间表达量差异可视化。分组信息:是一个有重复值离散型向量,分组向量元素和表达矩阵是一一对应

14100
领券