前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言实现结构突变数据的整合

R语言实现结构突变数据的整合

作者头像
一粒沙
发布2021-09-15 11:29:12
9070
发布2021-09-15 11:29:12
举报
文章被收录于专栏:R语言交流中心R语言交流中心
基因组结构性变异(Structuralvariation, SV)通常指基因组上大长度的序列变化和位置关系变化。基因组结构性变异类型很多,包括长度在50bp以上的长片段序列插入或者删除(Big Indel)、串联重复(Tandem repeate)、染色体倒位(Inversion)、染色体内部或染色体之间的序列易位(Translocation)、拷贝数变异(CNV)以及形式更为复杂的嵌合性变异。这些突变的影像比起SNP更大,和疾病进行关联分析甚至是直接的致病诱因。其常用的软件有Manta, Delly,AS-GENSENG,BICseq2,CNVnator,BreakDancer,Breakway,CLEVER等。今天给大家介绍个在R语言中进行对预测结果进行整合和后期可视化展示的包intansv。首先看下包的安装:
代码语言:javascript
复制
BiocManager::install("intansv")

接下来直接用实例来看下:

代码语言:javascript
复制
1. 读取breakDancer的函数参数设置:
代码语言:javascript
复制
##读取breakDancer的预测结果,并进行预处理
breakdancer.file.path<-system.file("extdata/ZS97.breakdancer.sv",package="intansv")
breakdancer<- readBreakDancer(breakdancer.file.path)

2. cnvnator结果读取的函数参数设置:

代码语言:javascript
复制
##读取cnvnator结果
cnvnator.dir.path<- system.file("extdata/cnvnator", package="intansv")
cnvnator <-readCnvnator(cnvnator.dir.path)

3. SVseq2的读取函数参数设置:

代码语言:javascript
复制
##读取SVseq2的结果
svseq.dir.path<- system.file("extdata/svseq2", package="intansv")
svseq <-readSvseq(svseq.dir.path)

4. DELLY预测结果的读取函数参数设置:

代码语言:javascript
复制
##DELLY结果提取
delly.file.path<- system.file("extdata/ZS97.DELLY.vcf",package="intansv")
delly <-readDelly(delly.file.path)

5. Pindel提取函数的参数设置:

代码语言:javascript
复制
##Pindel结果的提取
pindel.dir.path<- system.file("extdata/pindel", package="intansv")
pindel <-readPindel(pindel.dir.path)

6. Lumpy预测结果的提取函数参数设置:

代码语言:javascript
复制
##Lumpy数据的提取
lumpy.file.path<-system.file("extdata/ZS97.LUMPY.vcf",package="intansv")
lumpy <-readLumpy(lumpy.file.path)

7. SoftSearch预测结果提取函数的参数设置:

代码语言:javascript
复制
##SoftSearch结果提取
softSearch.file.path<- system.file("extdata/ZS97.softsearch",package="intansv")
softSearch<- readSoftSearch(softSearch.file.path)
代码语言:javascript
复制
###结果的整合
sv_all_methods<- methodsMerge(breakdancer, pindel, cnvnator, delly, svseq)
代码语言:javascript
复制
###突变的注释,会分别注释三种结构突变
anno.file.path<- system.file("extdata/chr05_chr10.anno.txt",package="intansv")
msu_gff_v7<- read.table(anno.file.path, head=TRUE, as.is=TRUE)
代码语言:javascript
复制
sv_all_methods.anno<- llply(sv_all_methods,svAnnotation,genomeAnnotation=msu_gff_v7)
代码语言:javascript
复制
###基因组层面的可视化
genome.file.path<- system.file("extdata/chr05_chr10.genome.txt",package="intansv")
genome <-read.table(genome.file.path, head=TRUE, as.is=TRUE)
代码语言:javascript
复制
plotChromosome(genome,sv_all_methods,1000000)
代码语言:javascript
复制
###区域的可视化
plotRegion(sv_all_methods,msu_gff_v7,"chr05", 1, 200000)

至此,此包的功能已全部介绍完成,当然如果想了解各个单独的结构突变分析的工具需要自行去看对应的软件的操作指南。

欢迎大家学习交流!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 R语言交流中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档