首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言数据集合并、数据增减、不等长合并

which.max 返回最大元素的索引 which.min 返回最小元素的索引 sample 随机在向量中抽取元素 subset 根据条件选取元素 sort 升序排列元素 rev 反转所有元素 order 获取排序后的索引...table 返回频数表 cut 将数据分割为几部分 split 按照指定条件分割数据 rbind 行合并 cbind 合并 merge 按照指定合并矩阵或者数据框 一、数据合并 1、merge(...2 7 2 其中,all=T代表全连接,all.x=T代表左联结;all.y=T代表右连接 2、dplyr包 dplyr包的数据合并, 一般用left_join(x,y,by="name") x...—————————————————————不等长合并 #如何解决合并时数据不等长问题——两种方法:do.call函数以及rbind.fill函数(plyr包) #rbind.fill函数只能合并数据框格式...#do.call函数在数据框中执行函数(函数,数据) library("plyr") #加载获取rbind.fill函数 #第一种方法 list1<-list() list1[[1]]=data.frame

13K12
您找到你想要的搜索结果了吗?
是的
没有找到

tidyverse:R语言中相当于python中pandas+matplotlib的存在

02 — tibble:高级数据框(data.frame升级版) ——数据()类型一目了然 tibble是R语言中一个用来替换data.frame类型的扩展的数据框,tibble继承了data.frame...,会自动添加列名 tibble,类型只能回收长度为1的输入 tibble,会懒加载参数,并按顺序运行 tibble,是tbl_df类型 tibble是data.frame的进化版,有如下优点:生成的数据框数据每可以保持原来的数据格式...例如:x %>% f(y) 等价于 f(x,y) Rstudio中快捷键: ctrl+shift+m R中自带的iris(鸢尾花数据集)为例: > head(iris,n=3) Sepal.Length...这些函数允许在长数据格式(long data)和宽数据格式(wide data)之间进行转换(功能类似于reshape包,但是比reshape更好用,并且可以用于管道%>%连接)。...key #value:将原数据框中的所有值赋给一个新变量value #…:可以指定哪些聚到同一中 #na.rm:是否删除缺失值 widedata <- data.frame(person=c('Alex

3.9K10

数据处理基础—什么是整齐数据和Rich Data

电子版可在此处获取:http://r4ds.had.co.nz/ 上面的不整齐数据是不整齐的,因为两个变量(Wins和Losses)存储在一(Category)中。这是数据不整齐的常见方式。...您应该将包含多个变量的的名称传递给key,并将包含多个变量值的的名称传递给value。...gather()获取名称是值的,key和valueas为两个参数。这次key是变量的名称,其值为列名,而value是值的名称,其值分布在多个列上。...如果您的数据以整齐的格式存储,您会发现分析单细胞RNA-seq数据要容易得多。幸运的是,我们通常用于促进单细胞RNA-seq分析的数据结构通常鼓励整齐的方式存储您的数据。 ?...这是每个细胞中每个基因的读数,除以每个细胞的文库大小(百万计)。 tpm:每百万的转录本。这是每个细胞中每个基因的转录物数量除以该细胞中转录物的总数(百万计)。

1.3K20

R语言 数据框、矩阵、列表的创建、修改、导出

data.frame生成指定数据框的列名及的内容,如代码所示,此时列名不需添加"",df1为变量名,格式为列名=的向量*matrix矩阵与向量一样只允许同一种数据类型,否则会被转换,可以理解为二维的向量...,data.frame数据框允许不同不同的数据类型,但同一只允许一种数据类型*数据框中括号内行在前df1 <- data.frame(gene = paste0("gene",1:4),...""#直接读取如果失败,需要指定参数#ex1 <- read.table("ex1.txt") #读入该文件后会发现原文件被认为没有列名,列名被当作第一行,字符型与数值型在一起会将所有数值型改为字符型满足向量同一类型...,需要分别指出作为公共的列名也可以借助dplyr包中的函数test1 <- data.frame(name = c('jimmy','nicker','Damon','Sophie'),...test2,by="name") #取左边的右边没有的数据框的导出write.csv(soft,file = "soft.csv") #导出数据框为csv的函数,此处soft为变量名,soft.csv应该写全提示阅读者

7.6K00

R语言数据结构(三)数据框

数据框有两个维度,分别表示行数和数,可以用dim()函数来获取。数据框中的每个向量可以有一个名称,可以用names()函数来获取或设置。...若为TRUE,则会检查数据框中变量的名称,确保它们是符合语法规范的变量名称且不重复。必要时,会进行调整(通过make.names函数)。...可以用dim()函数获取。...而数据框的行名和列名分别对应着数据框的行和的标识符,可以用row.names()和colnames()函数来获取和设置。 行名:数据框的每一行都有一个行名,用于标识不同的行。...行名是一个字符向量,可以通过row.names()函数获取或设置。 列名:数据框的每一都有一个列名,用于标识不同的。列名是一个字符向量,可以通过colnames()函数获取或设置。

21330

R语言数据分析利器data.table包 —— 数据框结构处理精讲

版权声明:本文为博主原创文章,转载请注明出处     R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。...可见它是属于data.table和data.frame类,并且取,维数,都可以采用data.frame的方法。...,而是允许处理的字符串在本机编码; quote,默认""",如果双引开头,fread强有力的处理里面的引号,如果失败了就会用其它尝试,如果设置quote="",默认引号不可用 strip.white...输出文件名,""意味着直接输出到操作台; append,如果TRUE,在原文件的后面添加; quote,如果"auto",因子和列名只有在他们需要的时候才会被加上双引号,例如该部分包括分隔符,或者"...,写出去时list成员间sep2分隔,它们是处于一之内,然后内部再用字符分开; eol,行分隔符,默认Windows是"\r\n",其它的是"\n"; na,na值的表示,默认""; dec,

5.6K20

R 数据可视化 01 | 聚类热图

常规聚类热图绘制 无分类信息热图 无聚类热图 分割聚类树热图 多分组聚类热图 分组调色 显示文本 去除描边 字体相关 调整聚类树高 聚类方法选择 保存为图片 详细参数设置说明 设置工作目录 载入数据 获取数据子集...fontsize_number = 8, # 设置字体大小 number_color = '#4a4a4a', #设置颜色 number_format = '%.2f' # 设置显示格式...选择合适的文件格式,调整合适长宽,印刷或投稿选PDF,TIFF,EPS就好 文件默认存储在刚刚设置的工作目录里 ?...获取数据子集 # 截取表达矩阵的一部分数据来绘制热图 exp_ds = dataset[c(1:60),c(1:10)] 原始数据: ?...如果获取前5个基因和cell1与cell2的前3个样本,只需要执行 exp_ds = dataset[c(1:5),c(1:3,6:8)] ?

1K20

ChIP-seq 分析:基因集富集(11)

落在 TSS 区域的峰将在我们带注释的 GRanges 对象的注释中标记为“启动子”。...annotatedPeaksGR_TSS$geneId) genesWithPeakInTSS[1:2] genesWithPeakInTSS 接下来,我们可以提取包含在 TxDb 对象中的所有基因,用作我们用于通路富集的基因域...TxDb.Mmusculus.UCSC.mm10.knownGene) allGeneGR[1:2, ] allGeneGR allGeneIDs <- allGeneGR$gene_id 一旦我们有了相同格式的基因列表和基因域...在这里,我们将使用 msigdbr 包从 MSigDB 获取基因集。我们还可以运行 msigdbr_collections 函数来查看将用于访问基因集的类别和子类别代码。...这里我们将使用“H”来访问 Hallmark 基因集,最后我们需要得到一个数据框,其中第一包含基因集的名称,第二包含基因 ID。

53420

rmarkdown+flexdashboard制作dashboard原型

其一是shiny+shinydashboard+诸多可视化系统及组件(图表、表格、文本信息),shinydashboard是相当于前端UI模板化的R语言api接口,你可以R语法的格式去配置交互控件以及组织页面逻辑...(docx、pdf、及各种tex格式),而且可以输出html网页。...Page Navigation——导航页支持二级菜单选择 Multiple Columns 当然flexdashboard可以支持多布局,只需要在代码中声明参数即可,而且可以自定义各宽。...Row Orientation 多行布局也多布局很相似,仅需将声明改为声明行即可。 ?...这里的icon支持直接从在线ui库中获取: Icon Sets You can specify icons from three different icon sets: Font Awesome——https

4.3K30

列表,表格与媒体元素

一.列表   列表就是信息资源的一种展示形式  1.列表及其应用    1)无序列表      无序列表由标签和标签组成,使用标签作为无序列表的声明,使用标签作为每个列表项的起始....定义列表的语法相对于有序和无序列表不太一样,它使用标签作为列表的开始,使用标签作为每个列表项的起始,而对于每个列表项的定义则使用标签来完成     语法:        ...:      >在video中虽然可以使用src属性链接视频路径,可是只能链接一种格式的视频,很难让每种浏览器都支持这种格式.所以就出现了source元素来解决这一问题,source元素嵌套在video...里面,并且可以出现多次,每个source元素对应一种格式的视频,这样,浏览器会在这些格式中选择自己可以识别的一种来进行播放      2)在video元素中指定controls属性可以在页面上默认的方式进行播放控制... 3.经验:   1)通过source引入的视频文件的格式至少包括WebM和MPEG4 或 Ogg和MPEG4   2)通过source引入的音频文件的格式至少包括WAV和MP3 或 Ogg和MP3

2.9K100

一起学Excel专业开发08:工作表的程序行和程序列

这些数据可以让Excel或者VBA程序使用,方便完成一些高级操作,例如检查用户输入是否存在错误、存储数据有效性列表项、计算的中间值、特殊的常量,等等。...图1 其中: 1.在A中,存放着设置数据有效性的列表项,这是一个级联列表,也就是说,在D中的列表项为类别中的“水果、蔬菜”,在E中的列表项根据D中的数据显示水果列表“苹果、香蕉、桔子、梨”或者蔬菜列表...3.选择单元格区域D3:E12,设置条件格式如下图2所示。 ?...图2 也就是说,当单元格区域D3:E12所在单元格对应的B中的单元格的值为True时,应用格式,即设置单元格背景色为红色,否则,正常显示。...小结 上面的示例利用隐藏区域(程序列): 1.实现了数据有效性级联列表项目的存储。 2.判断数据是否满足工作表中设置的规划,利用条件格式设置进行提示,从而实现了对用户输入数据的自动检查。

1.3K10

解读年度数据库PostgreSQL:如何巧妙地实现缓冲区管理器

获取相应散桶槽分区上的BufMappingLock共享锁。 查找标签为'Tag_C'的条目,并从条目中获取buffer_id。本例中buffer_id为2。...第一,创建所需页面的buffer_tag(本例中buffer_tag为'Tag_E')并计算其散桶槽。 第二,共享模式获取相应分区上的BufMappingLock。...从freelist中获取空缓冲区描述符,并将其钉住。在本例中所获的描述符:buffer_id=4。 独占模式获取相应分区的BufMappingLock(此锁将在步骤(6)中被释放)。...排他模式获取缓冲区表中旧表项所在分区上的BufMappingLock。...第二,独占模式获取表项所在分区上的BufMappingLock。 第三,将新表项插入缓冲区表中。 从缓冲表中删除旧表项,并释放旧表项所在分区的BufMappingLock。

89810

学徒带你一步步从CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵进行热图可视化

我们可以看到里面有很多数据,我们挑选RSEM gene和Gene definitions (GENCODE19, GTEx7)(这个用来获取基因ID) 点击下载就可以哈。 ?...- fread("gencode.v19.genes.v7_model.patched_contigs.gtf.gz",data.table = F)#这一步至关重要,大家可以尝试变成T 然后看看数据格式...id$V9 这里我们发现第九内容很多,然后画红线的就是我们需要获取的数据。 ? 看一下第三 table(id$V3) 第三有3种,我们这里需要的是GENE ?...获取只有gene的所有行 id1<- id[grepl("gene",id$V3),] 然后我们处理第九 library(stringr) options(stringsAsFactors = F)...(x3))) 将细胞的名字全部取出来,变成数据框 因为我喜欢处理数据框 w3<- data.frame(n=colnames(x3), n2=rep(1,1021)) #建立相匹配的

4.1K31
领券