首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据挖掘第三天(数据结构)

矩阵只允许一种数据类型,数据框每一列只允许一种数据类型 一、数据框来源 (1)用代码新建 图片 (2)由已有数据转换或处理得到 (3)读取表格文件 (4)R语言内置数据 二、数据框取子集 用“$”符号...按逻辑值取,数据框按逻辑值取子集,TRUE对应行/列留下,FALSE对应行/列丢掉 #筛选score > 0行,筛选是行,是score>0df1$score #先筛选df1数据框里score...这一列 [1] 5 3 -2 -4 df1$score>0 #返回是逻辑值 [1] TRUE TRUE FALSE FALSE df1[df1$score > 0,] #括号里表示score...#最后一行用nrow代替 [1] 5 3 -2 -4, 数据框修改:取值+赋值 修改行名和列名,其实就是修改向量,要修改全部行名就给全部赋值,如果要改一个列名就给取子集赋值。...如:修改第二列列名,就是修改【列名这个向量】第二个元素 rownames(df1) <- c("r1","r2","r3","r4")#修改行df1 gene change score

42120
您找到你想要的搜索结果了吗?
是的
没有找到

pandas多级索引骚操作!

1、多层级索引创建 多级索引创建分两种情况。一种是只有纯数据,索引需要新建立;另一种是索引可从数据获取。 因为两种情况建立多级索引方法不同,下面分情况来介绍。...行索引、列索引赋值 df.index = mindex df.columns = mcol display(df) 02 从数据获取多级索引 第二种情况是我们既有数值数据又有维度数据,此时可以使用透视方法比如...=1) # 修改行二级索引 df.columns.set_levels(['2020','2021'], level=0) # 修改列一级索引 df.columns.set_levels(['机械','...函数可以按指定顺序进行重新排序,order参数可以是整数level层级或者字符串索引名,用法如下。...土木')], dtype='object') 然后再通过pythonjoin字符串拼接用法就实现了索引拼接。

60230

3.9生信

图片 数据框来源: 可由代码新建、已有数据转换或处理、读取表格文件、R语言内置数据 内置数据多用于新手练习,eg:iris、volcano、letters、LETTERS 新建数据框: 图片 ##A....按名字 df1【,"gene"】 df1【,c('gene','change')】 d.按条件(逻辑值) df1【df1$score>0,】 图片 图片 如何取数据框最后一列?...ncol(df1) 知道了行数就方便取最后一列:df1【,ncol(df1)】 这样子方便代码复用。 如何取数据框除了最后一列以外其他列?...是针对逻辑值使用 C.数据框修改 a.改一个格 df1【3,3】 <- 5 b.改一整列 df1$score <- c(12,23,50,2) c.改行名和列名 rownames(df1) = c("r1...","r2","r3","r4") 修改行名 d.只修改某一行/列名 colnames(df1)【2】 = "CHANGE" 将第二列名字改为CHANGE e.两个数据框连接merge merge

1.3K30

Python字符串String去除出换行符(n,r)和空格问题

Python字符串String去除出换行符和空格问题(\n,\r) 在Python编写过程,获取到字符串进场存在不明原因换行和空格,如何整合成一个单句,成为问题。...实际问题: 如图: string内容 其中,“ · ”代表为空格,一段话被换行成了几段。 1.使用 .strip() 只能够去除字符串首尾空格,不能够去除中间空格。...原因在于:在python存在继承了 回车符\r 和 换行符\n 两种标记。 \r和\n 都是以前那种打字机传承来。 \r 代表回车,也就是打印头归位,回到某一行开头。...win下用\r\n表示换行。...python同样一句话:print (u'前面的内容\r只显示后面的内容') 所以,在去除换行时,需要同时去除两者才行,即使用 .replace('\n', '').replace('\r', '')

3.9K20

从零开始异世界生信学习 R语言部分 02 数据结构之数据框、矩阵、列表

数据框 data.frame 数据框 约等于表格:1.数据框不是一个具体文件,只是R语言内部一个数据;2.数据框每一列只能有一种数据类型 图片 新建和读取数据框 #新建和读取数据框 df1 <- data.frame...## 括号逗号表示维度分隔 ## 按名字 df1[,"gene"] df1[,c('gene','change')] ## 按条件(逻辑值) df1[df1$score>0,] ## 代码思维...增加一列 在$后面写一个不存在列名表示增加一列 df1$p.value <- c(0.01,0.02,0.07,0.05) df1 #改行名和列名 rownames(df1) <- c("r1",..."r2","r3","r4") #只修改某一行/列名 colnames(df1)[2] <- "CHANGE" # | 或符号前后不可以连接字符,只能用于数字,逻辑值 两个数据框连接 test1 <...,对数据框进行组合

1.8K20

R语言-03数据框、矩阵和列表

matrix 矩阵-二维,只允许一种数据类型data.frame 数据框-二维,每列只允许一种数据类型list列表:可装万物1.数据框来源(1)用代码新建(2)由已有数据转换或处理得到(3)读取表格文件(4)R语言内置数据...(没有赋值就可以直接使用数据,例如iris)2.新建数据框*读取文件df2<-read.csv("gene.csv")df2#读取"gene.csv"文件,赋值df23.数据框属性4.数据框取子集df1...$gene #"$"前是数据框名称 后是列名;提取该列向量#按名字取子集 df1 行,列 图片5.数据框修改取子集,赋值#改行名和列名rownames(df1) <- c("r1","r2","r3...","r4") #修改全部行名#只修改某一行/列名colnames(df1){2} <- "CHANGE" #修改一个列名6.两个数据框连接按照共同列名取交集,后连接两个数据框列中有交集时既可以使用...名字”-names()后置难点 数据框按照逻辑值取子集#将逻辑值赋值给k,按逻辑值在df1取子集**实战中会经常遇到删除变量数据结构总结以上来源,生信技能树

7700

数据导入与预处理-拓展-pandas筛选与修改

数据筛选与修改 数据增删改查是 pandas 数据分析中最高频操作,在分组、聚合、透视、可视化等多个操作,数据筛选、修改操作也会不断出现。...数据修改–修改行索引 将第(国家奥委会)一列设置为索引 # 数据修改--修改行索引 将第(国家奥委会)一列设置为索引 df.set_index("国家奥委会").head() 输出为: #...max(0) 输出为: 金牌数 39 银牌数 41 铜牌数 33 dtype: int64 查看行数据中指定多列最大值 如果查看每个国家中金牌数银牌数铜牌数最大值 df_new.bfill...数据筛选-筛选指定列名 # 提取 金牌数、银牌数、铜牌数 三列 df_new[['国家奥委会','金牌数','银牌数','铜牌数']] 输出为: 提取全部列名以 “数” 结尾列 # 提取全部列名以...国行 # 筛选行|条件(包含指定值) # 提取 国家奥委会 列,所有包含 国df_new[df_new.国家奥委会.str.contains('国',na=False)] # 如果列中有字符串和数字类型需要家

1.3K20

Python字符串String去除出换行符(n,r)和空格问题「建议收藏」

Python字符串String去除出换行符和空格问题(\n,\r) 在Python编写过程,获取到字符串进场存在不明原因换行和空格,如何整合成一个单句,成为问题。...实际问题: 如图: string内容 其中,“ · ”代表为空格,一段话被换行成了几段。 1.使用 .strip() 只能够去除字符串首尾空格,不能够去除中间空格。...原因在于:在python存在继承了 回车符\r 和 换行符\n 两种标记。 \r和\n 都是以前那种打字机传承来。 \r 代表回车,也就是打印头归位,回到某一行开头。...win下用\r\n表示换行。...python同样一句话:print (u'前面的内容\r只显示后面的内容') 所以,在去除换行时,需要同时去除两者才行,即使用 .replace('\n', '').replace('\r', '')

2.7K20

盘点66个Pandas函数,轻松搞定“数据清洗”!

df["编号"].replace(r'BA.$', value='NEW', regex=True, inplace = True) 输出: 在Pandas模块, 调⽤rank()⽅法可以实现数据排名...df["排名"] = df.rank(method="dense").astype("int") 输出: rank()⽅法method参数,它有5个常⽤选项,可以帮助我们实现不同情况下排名。...split 分割字符串,将一列扩展为多列 strip、rstrip、lstrip 去除空白符、换行符 findall 利用正则表达式,去字符串匹配,返回查找结果列表 extract、extractall...df.reset_index(drop=True) 输出: rename()重命名用于更改行标签,即行列索引。可以传入一个字典或者一个函数。在数据预处理,比较常用。...如果想直接筛选包含特定字符字符串,可以使用contains()这个方法。 例如,筛选户籍地址列包含“黑龙江”这个字符所有行。

3.7K11

R3数据结构和文件读取

组合paste0)#注释1seq()函数可以生成-3到3之间100个数等差数列,代码如下:seq 0,]#某列>0行筛选出来,还是二维## gene CHANGE score## r1 gene1 up 5## r2 gene2...up 3#筛选score >0基因,某列>0某列元素筛选出来,一维df1[df1$score > 0,1]## [1] "gene1" "gene2"df1$gene[df1$score...改行名和列名rownames(df1) <- c("r1","r2","r3","r4")#只修改某一行/列名colnames(df1)[2] <- "CHANGE"#6.两个数据框连接,mergetest1...它可以接受任何单个字符或字符串作为参数,用于将文本数据内容分割成列。常见分隔符包括逗号(,),制表符(\t),分号(;)等。例如,当读取以逗号分隔CSV文件时,应该将sep参数设置为逗号(,)。

2.7K00

R数据结构(Array,Factor,List,DataFrame)

1、R数据结构-Array #一维数组 x1 <- 1:5; x2 <- c(1,3,5,7,9) x3 <- array(c(2, 4, 6, 8, 10)) #多维数组 xs <- array...,都可以修改 x1[3] <- 30 #删除,凡是能够访问到地方,都可以删除 x1[-3] x1 <- x1[-3] #查找/过滤 x1[x1 >= 4] 2、R数据结构-Factor Factor...order(data[, 1]),] data <- read.csv('1.csv', fileEncoding='utf8', stringsAsFactors=FALSE); data[, 2] 3、R数据结构...-List 数组元素要求是同类型(不同类型会转成同一类型),List则可以组合多种不同类型对象。...,设置为NULL,即为删除, #注意,删除之后,它后面的位置索引都自动减一 j$sex <- NULL; j #四、检索 j=='Joe' #五、查看长度 length(j) 4、R数据结构-DataFrame

2.3K90
领券