首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

R语言 | 第一部分:数据预处理

1.创建数据集/矩阵【data.frame数据框、matrix矩阵、array数组】 #数据框:将字段以列合并在一起。...=2) #共6个元素,分2行,每行3个元素,未指定行名和列名 m3 <- matrix(1:6,ncol=3) #共6个元素,结果与创建形式2相同m4 <- matrix(nr=2,nc=3) #未指定元素数据...,默认为NA,2行3列,nr是nrow简写,nc是ncol简写,R能识别 #数组 mydata <- array(1:12,c(2,3,2),dimnames=list(c("r1","r2"),c...age<=75] <- "Middle Aged" agecat2[age<55] <- "Young"}) 5.修改变量名【rname】 library(plyr)leadership <- rename...【进阶】数据库相关dplyr install.packages("dplyr") library(dplyr)】 dplyr包最常使用函数主要包括以下几个:变量筛选函数:select数据筛选函数:filter

1.1K00

R语言 | 第一部分:数据预处理

1.创建数据集/矩阵【data.frame数据框、matrix矩阵、array数组】 #数据框:将字段以列合并在一起。...=2) #共6个元素,分2行,每行3个元素,未指定行名和列名 m3 <- matrix(1:6,ncol=3) #共6个元素,结果与创建形式2相同 m4 <- matrix(nr=2,nc=3) #未指定元素数据...,默认为NA,2行3列,nr是nrow简写,nc是ncol简写,R能识别 #数组 mydata <- array(1:12,c(2,3,2),dimnames=list(c("r1","r2"),c...age<=75] <- "Middle Aged" agecat2[age<55] <- "Young"} ) 5.修改变量名【rname】 library(plyr) leadership <- rename...【进阶】数据库相关dplyr install.packages("dplyr") library(dplyr)】 dplyr包最常使用函数主要包括以下几个: 变量筛选函数:select 数据筛选函数

92020

《高效R语言编程》6--高效数据木匠

tibble会打印每个变量类,data.frame不会 stringAsFactors默认不转换 输出时,只输出前10行 使用tidyr与正则表达式整理数据 整理数据包括数据清理和数据重构,前者是重定格式与标记脏数据...用法是:gather(data,key,value,-religion),分别是数据框,要转换成分类列名,单元值列名和清除收集变量 使用seperate()分割联合变量 分割是指将一个实际由两个变量组成变量分割成两个独立列...列改名 rename(),使用反引号‘`’包裹,允许R使用不规范列名。...unlist()函数作用,就是将list结构数据,变成非list数据,即将list数据变成字符串向量或者数字向量形式。...数据库与dplyr 必须使用src_*()函数创建一个数据源。# 使用data.table()处理数据 是dplyr替代,两个哪个好存在争议,最好学一个一直坚持下去。

1.9K20

「R」dplyr 列式计算

❝在近期使用dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列dplyr」 函数变体已经过期,看来后续要退休了,使用 across() 是它们统一替代品,所以最近抽时间针对性学习和翻译下...如果你想要通过函数转换列名,可以使用 rename_with()。..._at() 函数是 「dplyr唯一你需要手动引用变量名地方,这让它们比较奇怪且难以记忆。 为什么过了这么久才发现 across()?...我们可以使用没有外部名称作为将数据框列解包单独列约定。 你如何转移已经存在代码?...它们已经有选择语义,所以通常以与 across() 不同方式使用,我们需要使用 rename_with() 代替。

2.4K10

R︱高效数据操作——data.table包(实战心得、dplyr对比、key灵活用法、数据合并)

data.table,还有一个比较特立独行函数: 使用:=引用来添加或更新一列(参考:R语言data.table速查手册) DT[, c("V1","V2") := list(round(exp(V1...),2), LETTERS[4:6])] DT[, c("V1","V2") := NULL] 通过list方式来更新了数据,以及使用null方式来删除列。...4、修改列名、行名 #把名字"old"列,设置"new" > setnames(DT,"old","new") #把"V2","V3"列,设置"V2.rating","V3.DataCamp"...—————————————————————— 实战一:在data.table如何选中列,如何循环提取、操作data.table列?...(x)] 还有 data$x 如果有很多名字很长指标,data.table如果按列进行遍历呢? data[,1]是不行,选中列方式是用列名

7.5K43

.NetCoreEF Core迁移数据库表统一添加前缀

在项目开发过程我们往往需要将项目数据库添加一个统一前缀。我们为什么要添加前缀呢?有的可能是公司规定,更多原因是项目和业务区分。 每个项目针对不同需求或业务场景,追加相应标识。...当项目到达一定规模后,数据库表前缀意义便体现出来了,有利于在海量数据定位单张数据表,在数据库拆分或者查问题时候比较方便一些。...逐个配置 在Entity Framework Core我们可以通过以下两种方式实现,逐个配置每个表前缀方式实现 Fluent API modelBuilder.Entity()...BlogId { get; set; } public string Name { get; set; } public string Url { get; set; } } 统一配置 那么如何在项目中统一添加前缀呢...IEntityTypeConfiguration modelBuilder.ApplyConfigurationsFromAssembly(this.GetType().Assembly); // 统一添加前缀

98440

tidyverse:R语言中相当于pythonpandas+matplotlib存在

,是弱类型,同时与data.frame有相同语法,使用起来更方便。...tibble对data.frame做了重新设定: tibble,不关心输入类型,可存储任意类型,包括list类型 tibble,没有行名设置 row.names tibble,支持任意列名 tibble...,会自动添加列名 tibble,类型只能回收长度1输入 tibble,会懒加载参数,并按顺序运行 tibble,是tbl_df类型 tibble是data.frame进化版,有如下优点:生成数据框数据每列可以保持原来数据格式...例如:x %>% f(y) 等价于 f(x,y) Rstudio快捷键: ctrl+shift+m 以R自带iris(鸢尾花数据集)例: > head(iris,n=3) Sepal.Length...:新建列名字符串向量 #sep:被拆分列分隔符 #remove:是否删除被分割列 widesep <- separate(wideunite, information,c("person"

3.9K10

R语言数据分析利器data.table包 —— 数据框结构处理精讲

版权声明:本文博主原创文章,转载请注明出处     R语言data.table包是自带包data.frame升级版,用于数据框格式数据处理,最大特点快。...data.table数据框也可使用dplyr管道,这里不作阐述。...,比如data.frame和data.table等; file,输出文件名,""意味着直接输出到操作台; append,如果TRUE,在原文件后面添加; quote,如果"auto",因子和列名只有在他们需要时候才会被加上双引号...(x)] #和上面一样 DT[x=="a"] # 和上面一样,和使用on一样,都是使用二分查找法,所以它们速度比用data.frame快。...with 默认是TRUE,列名能够当作变量使用,即x相当于DT$"x",当是FALSE时,列名仅仅作为字符串,可以用传统data.frame方法并且返回data.table,x[, cols, with

5.6K20

R语言数据处理:飞机航行距离与到达延误时间有什么关系??

而本文介绍dplyr包简直就是Hadley Wickham (ggplot2包作者,被称作“一个改变R的人”)大神我们提供“数据再加工”神器啊。...包,该软件包飞机航班数据将用于本文中dplyr包相关函数演示。...2.2 列名重命名 为了让列名简单易懂,可以使用rename函数,进行列名重命名。...2.4 数据排序 为了数据整齐性,我们可以选择相应变量进行排序。这里要穿插一个排序函数arrange(),默认情况下,升序排列,也可以对列名加desc()进行降序排序。...3.2 应用函数及组合结果 我们使用dplyrsummarize()函数,进行数据统计指标的获取及组合。计算出不同目的地平行航行距离以及平均延误时间。

3K40

生信马拉松 Day7

tab出列名,再删去数据框名字,防止写错 identical(a$Sepal.Length,test$Sepal.Length) #这个函数意思是否相同,可以用来检查是不是真的排序了 2.2 distinct...#新增列名为new,值Sepal.Length * Sepal.Width一列 2.4 管道符 #原始代码 x1 = select(iris,-5) #选择除了第5列iris数据集 x2 = as.matrix...…) # 对列表/向量每个元素实施相同操作 lapply(1:4,rnorm) #=rnorm(1),rnom(2),rnorm(3),rnom(4),得到一个分别是1/2/3/4个元素list...) library(dplyr) dat = t(exp) %>% #转置,得到matrix as.data.frame() %>% #变data.frame rownames_to_column...2种方法 2.如何把数据框某列“ ”转换为NA iris$Species[iris$Species=='']=NA 3.如何删除多余信息 #这里示例数据,a$tumor_stage.diagnoses

23200

R语言学习笔记之——数据处理神器data.table

data.table 1、I/O性能: data.table被推崇重要原因就是他IO吞吐性能在R语言诸多包首屈一指,这里以一个1.6G多2015年纽约自行车出行数据集例来检验其性能到底如何,...使用fread函数导入之后便会自动转化为data.table对象,这是data.table所特有的高性能数据对象,同时继承了data.frame传统数据框类,也意味着他能囊括很多数据框方法和函数调用。...data.table列索引 列索引与数据框相比操作体验差异比较大,data.table列索引摒弃了data.frame时代向量化参数,而使用list参数进行列索引。...注意以上新建列时,如果只有一列,列名比较自由,写成字符串或者变量都可以,但是新建多列,必须严格按照左侧列名为字符串向量,右侧列表模式,当然你也可以使用第二种写法。...当整列和聚合单值同时输出时,可以支持自动补齐操作。 当聚合函数与data.table分组参数一起使用时,data.table真正威力才逐渐显露。 mydata[,.

3.6K80

R语言 数据框、矩阵、列表创建、修改、导出

data.frame生成指定数据框列名及列内容,如代码所示,此时列名不需添加"",df1变量名,格式列名=列向量*matrix矩阵与向量一样只允许同一种数据类型,否则会被转换,可以理解二维向量...行名、列名)dim维度,对数据框使用,输出(行数,列数),nrow输出行数,ncol输出列数dim(df1)nrow(df1)ncol(df1)rowname输出行名,colname输出列名*注意没有...$score <- c(12,23,50,2) #列名为score列赋值新向量 df1新增列*新增列名与已有的列名不能一样,否则就是修改向量,默认添加到最后df1$p.value <- c(0.01,0.02,0.07,0.05...dplyr函数test1 <- data.frame(name = c('jimmy','nicker','Damon','Sophie'), blood_type...2倍标准差,并写出用户使用该函数代码 。

7.6K00

玩转数据处理120题|Pandas&R

) # [1] "grammer" "score" 4 修改列名 题目:修改第二列列名为'popularity' 难度:⭐⭐ Python解法 df.rename(columns={'score':'...popularity'}, inplace = True) R语言解法 df % rename(popularity = score) 5 字符统计 题目:统计grammer列每种编程语言出现次数...(df,df1) %>% rename(`0` = df1) # 非常规命名需要用``包裹变量名 44 数据计算 题目:生成新一列newsalary列减去之前生成随机数列 难度:⭐⭐ Python...::rename(`0` = V1) 83 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个0-100固定步长数 Python解法 tem = np.arange...难度:⭐⭐ 备注 从数据2读取数据并在读取数据时将薪资大于10000改为高 Python解法 df2 = pd.read_csv(r'C:\Users\chenx\Documents\Data

6K41

Day07 生信马拉松-数据整理R

(x) # 引号内单个字母/数字/符号数量 length(x) #检测向量内元素数 1.2 字符串拆分 str_split(x," ") #直接拆分后会变成list子集 class(str_split...(x2,"h") # 第一个参数向量名,第二个是检测关键词 str_starts(x2,"T") #判断x2T开头字符串,输出逻辑向量 str_ends(x2,"e") #判断x2e结尾字符串...,将样本名转化为data.frame第一列 ggplot2对行名并不友好,通常要使样本名转化为data.frame第一列,防止在后续代码运行过程中行名丢失 图片 图片 step2 把原来行名转变为第一列...= starts_with("gene"), # pivot_longer()宽变长函数,starts_with("gene")内需要宽长转换列名 names_to...### ggplot2 分面相关设置(facet)详解 7.一些实操便捷函数 7.1 match() 函数 load("matchtest.Rdata") x y ## 把y列名正确替换为x里面的

21100

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券