专栏首页生信技能树【直播】我的基因组62:用Delly检测SV

【直播】我的基因组62:用Delly检测SV

人类单体型(Haplotype)及单核苷酸多态性位点(Single Nucleotide Polymorphism, SNP),能够揭示对药物和环境因子的个体反应差异,是将健康和疾病研究深入到分子水平的重要遗传信息。

以前我对全基因组重测续的研究也大多是找到SNV即可。但这次毕竟是我自己的基因,虽然以前没有做过SV,但还是想看看。

SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。

详细的生物学解释,还有图文并茂的讲述大家可以自行阅读下面的课件和综述。人类基因组中很多结构变异(Structure Variation, SV)是正常的,这种良性 SV 不会导致疾病发生。

http://www.mi.fu-berlin.de/wiki/pub/ABI/GenomicsLecture10Materials/structural-variation.pdf

工具也挺多,去omictools搜索可以看到一大把,而且看最新的综述(Structural variation detection using next-generation sequencing data A comparative technical review) 里面也有详细列出这些工具和工具的比较!

插入(Insertion, INS)

缺失(Deletion, DEL)

反转(Inversion, INV)

染色体内部易位(Intra-chromosomal Translocation, ITX)

染色体间易位(Inter-chromosomal Translocation, CTX)

我们就是要从PE150bp的测序数据里面找到上面的5种的现象!

使用Delly检测SV

Delly软件的下载地址为https://github.com/dellytools/delly,下载后可以直接使用,无需安装,同时delly支持多线程运算,只需在运行命令行前加 export OMP_NUM_THREADS=8

我的代码如下:

export OMP_NUM_THREADS=5
bam=/home/jianmingzeng/data/project/myGenome/fastq/jmzeng.filter.rmdup.bam
excl=/home/jianmingzeng/biosoft/delly/delly/excludeTemplates/human.hg19.excl.tsv
genome=/home/jianmingzeng/reference/genome/hg19/hg19.fa
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DEL -g $genome -o DEL.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DUP -g $genome -o DUP.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INV -g $genome -o INV.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t TRA -g $genome -o TRA.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INS -g $genome -o INS.bcf -x $excl $bam
ls *bcf|while read id ;do bcftools view $id >${id%%.*}.vcf ;done

不大记得耗时多久了,反正时间对我来说无所谓,因为读懂它的结果耗时更长,结果如下:

对检测到的SV进行genomic feature的注释

根据样品检测得到的SV变异在参考基因组上的位置信息,对比参考基因组的基因、CDS位置等信息(一般在gff文件中),可以注释SV变异是否发生在基因间区、基因区或CDS区等。对缺失(DEL)、插入(INS)、反转(INV)3种类型的结构变异注释进行注释!

这里我选择的是Bioconductor 的intansv包!

https://bioconductor.org/packages/release/bioc/html/intansv.html

反正我只会用了软件,会跑流程,至于结果怎么看,我真心不懂,还需要持续学习,估计等过了100讲,我会推出SV的续集,敬请期待~

这个,就后续再介绍咯!

文:Jimmy

图文编辑:吃瓜群众

本文分享自微信公众号 - 生信技能树(biotrainee),作者:Jimmy

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-03-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 神技能-自动化批量从PDF里面提取表格

    很简单,就是参考文献的28个免疫基因集拿出来,对从GEO下载的表达矩阵进行ssGSEA分析的结果热图呈现即可,比较难的应该是理解那28个免疫基因集,并且拿到每个...

    生信技能树
  • linux系统环境变量一文就够

    Linux是一个多用户的操作系统。每个用户登录系统后,都会有一个专用的运行环境。 通常每个用户默认的环境都是相同的,这个默认环境实际上就是一组环境变量的定义。 ...

    生信技能树
  • 用R语言写爬虫收集整理所有开放期刊影响因子及审稿时长

    昨天发了使用R语言写爬虫解析peerJ的细节教程,peerJ期刊探索 但是感兴趣的不多。 不过,偶然间看到一个比我做的更好的,几乎爬取了所有的开放期刊,计算它...

    生信技能树
  • 【原创】Java并发编程系列19 | JDK8新增锁StampedLock

    StampedLock是 JDK1.8 版本中在 J.U.C 并发包里新增的一个锁,StampedLock是对读写锁ReentrantReadWriteLock...

    java进阶架构师
  • 探索 JUC 之美---可重入读写锁 ReentrantReadWriteLock可重入读写锁 ReentrantReadWriteLock实现AQS只有一个状态,那么如何表示 多个读锁 与 单个写锁

    JavaEdge
  • 当年戴VR开真车的那群人...最近他们玩出了更牛掰的克隆对决...

    话说,去年的时候,有过这么一个事儿。 当时嘉实多极护找来了英国Top Gear的Stig兄——Ben Collins,和美国极限运动的高手——漂移车手Matt ...

    静一
  • salesforce零基础学习(八十)使用autoComplete 输入内容自动联想结果以及去重实现

    项目中,我们有时候会需要实现自动联想功能,比如我们想输入用户或者联系人名称,去联想出系统中有的相关的用户和联系人,当点击以后获取相关的邮箱或者其他信息等等。这种...

    用户1169343
  • 【STM32H7教程】第30章 STM32H7的USART应用之八个串口FIFO实现

    完整教程下载地址:http://forum.armfly.com/forum.php?mod=viewthread&tid=86980

    armfly
  • InnoDB存储引擎文件

    与InnoDb存储引擎密切相关的文件包括重做日志文件和表空间文件,首先来说说我对表空间文件的理解。表空间文件是用来存储表信息和表数据的,它默认的大小是1...

    AsiaYe
  • Java微信公众平台开发(四)--回复消息的分类及实体的创建

    前面有说道对接收到微信服务器消息后对消息的分类,当时主要分为普通消息和事件消息,这里我们要讲述的是我们在给用户回复的消息类型,在这里也可以大致分为两类:一种为不...

    用户2417870

扫码关注云+社区

领取腾讯云代金券