【直播】我的基因组62:用Delly检测SV

人类单体型(Haplotype)及单核苷酸多态性位点(Single Nucleotide Polymorphism, SNP),能够揭示对药物和环境因子的个体反应差异,是将健康和疾病研究深入到分子水平的重要遗传信息。

以前我对全基因组重测续的研究也大多是找到SNV即可。但这次毕竟是我自己的基因,虽然以前没有做过SV,但还是想看看。

SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。

详细的生物学解释,还有图文并茂的讲述大家可以自行阅读下面的课件和综述。人类基因组中很多结构变异(Structure Variation, SV)是正常的,这种良性 SV 不会导致疾病发生。

http://www.mi.fu-berlin.de/wiki/pub/ABI/GenomicsLecture10Materials/structural-variation.pdf

工具也挺多,去omictools搜索可以看到一大把,而且看最新的综述(Structural variation detection using next-generation sequencing data A comparative technical review) 里面也有详细列出这些工具和工具的比较!

插入(Insertion, INS)

缺失(Deletion, DEL)

反转(Inversion, INV)

染色体内部易位(Intra-chromosomal Translocation, ITX)

染色体间易位(Inter-chromosomal Translocation, CTX)

我们就是要从PE150bp的测序数据里面找到上面的5种的现象!

使用Delly检测SV

Delly软件的下载地址为https://github.com/dellytools/delly,下载后可以直接使用,无需安装,同时delly支持多线程运算,只需在运行命令行前加 export OMP_NUM_THREADS=8

我的代码如下:

export OMP_NUM_THREADS=5
bam=/home/jianmingzeng/data/project/myGenome/fastq/jmzeng.filter.rmdup.bam
excl=/home/jianmingzeng/biosoft/delly/delly/excludeTemplates/human.hg19.excl.tsv
genome=/home/jianmingzeng/reference/genome/hg19/hg19.fa
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DEL -g $genome -o DEL.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DUP -g $genome -o DUP.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INV -g $genome -o INV.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t TRA -g $genome -o TRA.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INS -g $genome -o INS.bcf -x $excl $bam
ls *bcf|while read id ;do bcftools view $id >${id%%.*}.vcf ;done

不大记得耗时多久了,反正时间对我来说无所谓,因为读懂它的结果耗时更长,结果如下:

对检测到的SV进行genomic feature的注释

根据样品检测得到的SV变异在参考基因组上的位置信息,对比参考基因组的基因、CDS位置等信息(一般在gff文件中),可以注释SV变异是否发生在基因间区、基因区或CDS区等。对缺失(DEL)、插入(INS)、反转(INV)3种类型的结构变异注释进行注释!

这里我选择的是Bioconductor 的intansv包!

https://bioconductor.org/packages/release/bioc/html/intansv.html

反正我只会用了软件,会跑流程,至于结果怎么看,我真心不懂,还需要持续学习,估计等过了100讲,我会推出SV的续集,敬请期待~

这个,就后续再介绍咯!

文:Jimmy

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-03-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

被 TensorFlowLite 刷屏了吧,偏要再发一遍

在本文中,Google 展示了 TensorFlow Lite 的框架构成以及一些功能特性。

2780
来自专栏机器之心

教程 | 从硬件配置、软件安装到基准测试,1700美元深度学习机器构建指南

选自Medium 作者:Slav 机器之心编译 参与:Quantum Cheese、Lj Linjing、蒋思源 在用了十年的 MacBook Airs 和云...

2585
来自专栏AI研习社

Github 项目推荐 | Windows 10上的 GPU 加速深度学习工具

有很多工具能够帮助开发者在 Linux 和 Mac 上构建深度学习环境(比如 Tensorflow,不幸的是,TensorFlow 无法在 Windows 上轻...

1072
来自专栏飞总聊IT

大数据那些事(24):没毕业的IMPALA

自从Dremel出来以后,跟风的行动就开始了。狗狗出品,必有跟屁虫,必有抄袭者,更有炒作的。Cloudera最开始宣传的时候,在2012年,它们做的一个新系统叫...

3237
来自专栏向治洪

移动客户端WebP 图片格式优化

前言 在移动端,图片一直是流量大头,一些商品列表和详情等页面,图片大小动不动就以几百K,当然在某些比较大的公司会根据具体情况去加载相应尺寸的图片,这就意味着服务...

2167
来自专栏包子铺里聊IT

[面试数据结构总结1] 牵一发而不动全身,Consistent Hashing

包子IT面试培训 助你拿到理想的offer! 有问题,问包子!Got question? Ask Baozi! Consistent Hashing 是一个经...

3384
来自专栏机器之心

业界 | Apache MXNet 发布 v0.11.0版,支持苹果Core ML和Keras v1.2

选自AWS 机器之心编译 参与:黄小天、路雪 近日,孵化于 Apache 软件基金会 Apache MXNet 发布了 v0.11.0 最终测试版本,它不仅具有...

30213
来自专栏啸天"s blog

FPS不稳定是什么原因?玩游戏FPS低怎么办?

1022
来自专栏phodal

3.15 让我们来看看开源世界的抄袭

两天前,发生了一件特别有意思的事, 饿了么前端团队在知乎专栏上,撰文《写在 Element 一周年之际》指出指责iview抄袭这件事?那么,问题来了这是不是真的...

1769
来自专栏UAI人工智能

OpenAI/Universe-万物

1355

扫描关注云+社区