首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言 数据框、矩阵、列表的创建、修改、导出

,如代码所示,此时列名不需添加"",df1为变量名,格式为列名=列的向量*matrix矩阵向量一样只允许同一种数据类型,否则会被转换,可以理解为二维的向量,data.frame数据框允许不同列不同的数据类型..."的单元格df1[,c('gene','change')] #取出列名为"gene"及"change"的单元格逻辑取子集df1[df1$score>0,] #取出列为score的向量中值大于0的数据对应的行...> 0] #先取出列名为gene的向量,在给出一个一一对应的逻辑向量数据框修改修改数据相当于定位取出数据后赋值,赋值需对应元素或向量df1[3,3] <- 5 #为第3行第3列数据赋值5df1df1...m <- matrix(1:9, nrow = 3) #生成一个向量并将其分为3行,生成的数据框行名和列名为[1,]等colnames(m) <- c("a","b","c") #加列名或行名均可以此实现...#取子集方法同数据框t(m) #转置行与列,数据框转置后为矩阵as.data.frame(m) #矩阵换为数据框列表列表内有多个数据框或矩阵,可通过list函数将其组成一个列表l <- list(m1

7.6K00
您找到你想要的搜索结果了吗?
是的
没有找到

R语言入门系列之一

a,b,c,sep=" ")a、b、c粘贴为一个字符串,空格分割tolower()转换为小写,toupper()转换为大写substring()substring(a,1,3)返回字符对象a中第1到第...()对向量元素排序,decreasing=TRUE则为降序,na.last=TRUE缺失排在最后,返回为元素排名sort()对对象元素排序(不限于向量),返回排序后的对象union()union(...=m, ncol=n) #使用向量生成m行n列的矩阵 matrix(NA, nrow=m, ncol=n) #生成一个m行n列的空矩阵 as.matrix(x) #将对象转换为矩阵 is.matrix(...x) #判断对象是否为矩阵 具体示例如下: 矩阵通过行、列id或者行列name对元素进行索引,也可以使用向量,id前加负号“-”则表示删除改行、列的元素,索引也可以引入逻辑判断,如下所示: 注意,...数据框元素索引有三种方法,第一种为通过列的序号索引,第二种通过列名字索引,第三种通过$变量名索引,如下所示: 可以使用attach()函数来数据框添加到当前平台,这样就可以直接使用列名字或变量名来调用数据框中的数据

3.8K30

生信技能树-R语言-day3

这些元素筛选出来#提示:%in%length(g %in% s) # 错误,因为%in%产生的逻辑中,T和F都存在,所以都会被计算个数,相当于length计算的是逻辑的个数g[g %in% s]#...:向量二维:矩阵matrix 只有一种数据源类型数据框 data.frame 每列只有一种数据类型list列表:可以装的下一切(数据,向量矩阵,数据框)数据框 新建新建数据框data.frame()...[第几行 ,第几列] = 赋值修改后的数据修改一个列的数据文件名$列名 = c()赋值修改后的向量(先提取一个列$,再修改)增加一列的数据文件名$列名 = c()赋值修改后的向量($提取的是一个全新的列名...,之前不存在的)修改行名rownames() = c()赋值修改后的向量 (行名都是一样的)修改其中一列的列名colnames(文件名)[第几列]= “”赋值列的名字(每一列名字都不一样)两个数据框的连接...,y]矩阵的转置和转换 t()转置(行和列互转,要先给列改名,不然转置没有区别> colnames(m) m a b

5410

【生信技能树培训笔记】R语言基础(20230112更新)

是否为字符型数据as族函数实现数据类型之间的转换as.numeric()将其他数据类型转换为数值型as.logical() 将其他数据类型转换为逻辑型as.character() 将其他数据类型转换为字符型本节函数...> length(intersect(g,s))[1] 32IV.向量筛选(取子集)用 TRUE对应的挑选出来,FALSE丢弃。...(叹号)重点:按照逻辑:中括号里是与x等长且一一对应的逻辑向量。按照位置:中括号里是由x下标组成的向量。因此,指定向量中的具体某个元素时,无论用逻辑还是位置来指定,都必须使用向量。...(m) #矩阵转换成数据框的数据结构 a b c1 1 4 72 2 5 83 3 6 9重点:数据框或举证转置之后,其数据结构都是矩阵。...若此时矩阵转换成数据框数据结构,则其数据类型依然全部为字符串类型。

3.9K51

生信课程note-3

class3数据框、矩阵和列表向量-一维:表格—二维 :matrix 矩阵-二维,只允许一种数据类型;data.frame数据框-二维,每列只允许一种数据类型。...list列表:可装万物 向量 矩阵 数据框 数字 列表 。用class可以判断是矩阵或数据框,还可以用is族函数来判断。...用于取子集的逻辑向量:与x对应,不必须由x生成。(例子中即通过score为gene取子集)记住,==是等于的意思,>-是赋值的意思## 代码思维#如何取数据框的最后一列?...m <- matrix(1:9, nrow = 3)colnames(m) <- c("a","b","c") #加列名矩阵取子集不支持$,数据框支持。...mm[2,]m[,1]m[2,3]m[2:3,1:2]mt(m):转置 行变列m<-as.data.frame(m) 转换为数据框 必须要赋值矩阵画热图: pheatmap::pheatmap(m)

1.3K40

2023.4生信马拉松day3-数据结构

回顾:多个数据的组织——数据结构-向量-一维数据;一个向量内部只能有一种数据类型,可以有重复;注:重复允许,不同的数据类型不允许!...#取第一行 第三行的前两个数(会继承行名、列名)#小tips:读懂error——dimensions#练习:筛选出向量g中下标为偶数的基因名。...这些元素筛选出来。...= "NAME")6.矩阵#新建矩阵m <- matrix(1:9, nrow = 3)#加列名colnames(m) <- c("a","b","c") m#取m的子集——注意矩阵中不能使用$进行取子集...ctrl+l小结图片-练习3-2# 1.统计内置数据iris最后一列有哪几个取值,每个取值重复了多少次table(iris[,ncol(iris)])# 2.提取内置数据iris的前5行,前4列,并转换为矩阵

1.4K00

R3数据结构和文件读取

[]前面是数据框或矩阵,[[]]前面是列#3单个向量4种操作:#(1)赋值加输出(2)数学计算,(3)条件判断生成的是逻辑,生成长度相等的逻辑(x==y,向量不一样长时,谁长取谁,(4)初级统计,(...(x有哪些元素在y不存在)#重点向量筛选(取子集)[]:中括号里面是向量(有4种生成方式)TRUE对应的挑选出来,FALSE丢弃。...(1)按照逻辑([]里面是逻辑,与x对应,不必由x生成):中括号里是与x等长且一一对应的逻辑向量(13个彩色球取出蓝色和绿色,x[x%in%y],13个数取>7,x[x>7]);(2)按照位置:中括号里是由...,修改全部行名或其中一个,本质还是向量修改## [1] "1" "2" "3" "4"colnames(df1)#列名## [1] "gene" "change" "score"#改行名和列名rownames...,回到[]:TRUE对应的挑选出来,FALSE丢弃。

2.7K00

MADlib——基于SQL的数据挖掘解决方案(10)——数据探索之主成分分析

(3) 计算相关矩阵R的特征 ? 和相应的特征向量: ?...与最大特征相关联的特征向量指示数据具有最大方差的方向。换句话说,就所有可能的方向而言,如果所有数据投影到该向量定义的直线上,则结果具有最大方差。...其中∑是对角矩阵,特征为 ? 的条目,主成分是V的行。最后使用贝塞尔修正(Bessel's correction)用N-1代N计算协方差。...该参数只用于稀疏矩阵。 val_id TEXT 稀疏矩阵中表示非零元素列名。该参数只用于稀疏矩阵。 row_dim INTEGER 矩阵的实际行数,指的是当矩阵换为稠密矩阵时所具有的行数。...如果为FLOAT类型,算法返回足够的主成分向量,使得累积特征大于此参数(标准差比例)。 grouping_cols(可选) TEXT 缺省为NULL。

1K20

Python人工智能:基于sklearn的数据预处理方法总结

对于以梯度和矩阵为核心的算法(比如,逻辑回归、支持向量机、神经网络等)中,数据的无量纲化可以加快模型的收敛速度;而对于基于距离的模型(比如,KNN、K-means聚类等),数据的无量纲化可以提高模型的预测精度...对数值型与字符型特征均可用) fill_value 当参数strategy为constant时,可输入字符串或数字表示要填充的,通常使用 copy 默认为True,创建特征矩阵的副本,反之则会将缺失填补到原来的特征矩阵中去...:特征常用,用于分类特征转换为分类数值。...1. preprocessing.LabelEncoder:标签专用(目标值),用于分类标签转换为分类数值 sklearn中的preprocessing.LabelEncoder方法可以十分方便地文字型标签转换为分类数值...,并将其转换为二维矩阵 Sex = np.array(train_data.loc[:, "Sex"]).reshape(-1,1) Embarked = np.array(train_data.loc

1.6K10

R语言基础5(绘图基础)

str_detect(x,"h")##是否含有关键词h,生成与X长度相等的逻辑向量,可用于向量取子集; str_detect(x,"h|s")##是否含有关键词h或者s,生成与X长度相等的逻辑向量...,可用于向量取子集; str_starts(x,"h")##是否以h开头,生成与X长度相等的逻辑向量,可用于向量取子集; str_ends(x,"h")##是否以h结束,生成与X长度相等的逻辑向量,...可用于向量取子集; str_replace(x,"o","a")#x中的o替换为a,只替换出现的第一个o; str_replace(x,"o|s","a")#x中的o或者s替换为a,只替换出现的第一个...o; str_replace_all(x,"o","a")#x中的o替换为a,替换所有的o; str_remove(x," ")##x中的第一个空格删除; str_remove_all(x," ")...theme_bw() p p + facet_wrap(~gene,scales = "free") 一些函数 # 1.match----- load("matchtest.Rdata") x y ## 如何把y的列名正确替换为

31971

从零开始的异世界生信学习 R语言部分 02 数据结构之数据框、矩阵、列表

数据框取子集 数据主要操作为按列取子集,取出来的为向量;按行去子集取出的仍为数据框。...## 中括号中的逗号表示维度的分隔 ## 按名字 df1[,"gene"] df1[,c('gene','change')] ## 按条件(逻辑) df1[df1$score>0,] ## 代码思维..."r2","r3","r4") #只修改某一行/列的名 colnames(df1)[2] <- "CHANGE" # | 或符号前后不可以连接字符,只能用于数字,逻辑 两个数据框的连接 test1 <...#矩阵的新建和取子集 m <- matrix(1:9, nrow = 3) colnames(m) <- c("a","b","c") #加列名 m m[2,] #矩阵取子集不支持使用$ m[,...1] m[2,3] m[2:3,1:2] m #矩阵中的重要函数 t(m) #行列的转置,行变列,列变行,行名和列名都跟着变换 as.data.frame(m) #换为数据框 #作图 pheatmap

1.8K20

R In Action|创建数据集

一、对象类型: 包括标量、向量矩阵、数组、数据框和列表。 1)向量(vector):用于存储数值型、字符型或逻辑型数据的一维数组。...dimnames包含了可选的、以字符型向量表示的行名和列名。...array函数创建: myarray <- array(vector, dimensions, dimnames) 其中:vector包含了数组中的数据,dimensions是一个数值型向量,给出了各个维度下标的最大...选择多行或多列时,下标i 和j 可为数值型向量。 3)数组:从数组中选取元素的方式与矩阵相同 4)数据框:可以使用前述(如矩阵中的)下标记号,亦可直接指定列名。...logical_value,sep="delimiter", row.names="name") 注1:help(read.table):更多详情 注2:stringsAsFactors=FALSE,可禁止字符型变量换为因子

1.5K40

Day3

注意事项:数据分析每一步都要有检查,代码不报错,不代表真的没错,需要检查目的是否达到数据框data.frame-**二维,与表格类似,每列是向量,只允许一种数据类型新建用代码新建df1 <- data.frame...(列名 =向量(列的内容), 列名 =向量(列的内容))###由已有数据转换或处理得到读取表格文件df2 <- read.csv("gene.csv")R语言内置数据属性dim(df1)#维度nrow(...df1)#行数ncol(df1)#列数rownames(df1)#行名colnames(df1)#列名取子集:取列: $按坐标: [] #2,2取第二行第二列按名字,c('gene','change')...= "NAME")# name为test1需要合并的列的列名矩阵matrix -**二维,只允许一种数据类型新建 <- matrix()取子集-[]转置-t()转换为数据框: as.data.frame...()画热图pheatmap::pheatmap()列表list:可装万物新建 <- list(m1 = , m2=)取子集[[]]、$补充:元素的“名字”-names()难点:数据框按逻辑取子集删除变量

6410

HAWQ + MADlib 玩转数据挖掘之(六)——主成分分析与主成分投影

主成分投影         主成分投影是指在主成分分析的基础上,通过正交变换原有的指标转换为彼此正交的综合指标,消除了指标间的信息重叠问题,并利用各主成分设计一个理想决策变量,以各被评价对象相应的决策向量在该理想决策向量方向上的投影作为一维的综合评价指标...该参数只用于稀疏矩阵。 val_id:TEXT类型,稀疏矩阵中表示非零元素列名。该参数只用于稀疏矩阵。...row_dim:INTEGER类型,矩阵的实际行数,指的是当矩阵换为稠密矩阵时所具有的行数。该参数只用于稀疏矩阵。...col_dim:INTEGER类型,矩阵的实际列数,指的是当矩阵换为稠密矩阵时所具有的列数。该参数只用于稀疏矩阵。...如果为FLOAT类型,算法返回足够的主成分向量,使得累积特征大于此参数(方差比例)。‘components_param’的值域为正整数或(0.0,1.0]。

1.1K60

R语言入门

我们接下来逐个介绍这些数据结构。 1、向量 向量是用于存储数值型、字符型或逻辑型数据的一维数组,单个向量中的数据必须拥有相同的数据类型。...如上所示,创建了一个4行5列的矩阵矩阵中的元素按照行填充,分表定义了行名、列名。 我们可以使用下标和方括号来选择矩阵中的行、 列或元素。...其中vector包含了数组中的数据, dimensions是一个数值型向量,给出了各个维度下标的最大,dimnames是可选的、各维度名称标签的列表。...可以使用(如矩阵中的)下标记号,亦可直接指定列名,或是使用$符号,如下例: 5、因子 变量可归结为名义型、有序型或连续型变量。名义型变量是没有顺序之分的类别变量。...函数factor()以一个整数向量的形式存储类别,整数的取值范围是[1...k](其中k是名义型变量中唯一的个数),同时一个由字符串(原始)组成的内部向量映射到这些整数上。

2.1K30
领券