【直播】我的基因组62:用Delly检测SV

人类单体型(Haplotype)及单核苷酸多态性位点(Single Nucleotide Polymorphism, SNP),能够揭示对药物和环境因子的个体反应差异,是将健康和疾病研究深入到分子水平的重要遗传信息。

以前我对全基因组重测续的研究也大多是找到SNV即可。但这次毕竟是我自己的基因,虽然以前没有做过SV,但还是想看看。

SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。

详细的生物学解释,还有图文并茂的讲述大家可以自行阅读下面的课件和综述。人类基因组中很多结构变异(Structure Variation, SV)是正常的,这种良性 SV 不会导致疾病发生。

http://www.mi.fu-berlin.de/wiki/pub/ABI/GenomicsLecture10Materials/structural-variation.pdf

工具也挺多,去omictools搜索可以看到一大把,而且看最新的综述(Structural variation detection using next-generation sequencing data A comparative technical review) 里面也有详细列出这些工具和工具的比较!

插入(Insertion, INS)

缺失(Deletion, DEL)

反转(Inversion, INV)

染色体内部易位(Intra-chromosomal Translocation, ITX)

染色体间易位(Inter-chromosomal Translocation, CTX)

我们就是要从PE150bp的测序数据里面找到上面的5种的现象!

使用Delly检测SV

Delly软件的下载地址为https://github.com/dellytools/delly,下载后可以直接使用,无需安装,同时delly支持多线程运算,只需在运行命令行前加 export OMP_NUM_THREADS=8

我的代码如下:

export OMP_NUM_THREADS=5
bam=/home/jianmingzeng/data/project/myGenome/fastq/jmzeng.filter.rmdup.bam
excl=/home/jianmingzeng/biosoft/delly/delly/excludeTemplates/human.hg19.excl.tsv
genome=/home/jianmingzeng/reference/genome/hg19/hg19.fa
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DEL -g $genome -o DEL.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DUP -g $genome -o DUP.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INV -g $genome -o INV.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t TRA -g $genome -o TRA.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INS -g $genome -o INS.bcf -x $excl $bam
ls *bcf|while read id ;do bcftools view $id >${id%%.*}.vcf ;done

不大记得耗时多久了,反正时间对我来说无所谓,因为读懂它的结果耗时更长,结果如下:

对检测到的SV进行genomic feature的注释

根据样品检测得到的SV变异在参考基因组上的位置信息,对比参考基因组的基因、CDS位置等信息(一般在gff文件中),可以注释SV变异是否发生在基因间区、基因区或CDS区等。对缺失(DEL)、插入(INS)、反转(INV)3种类型的结构变异注释进行注释!

这里我选择的是Bioconductor 的intansv包!

https://bioconductor.org/packages/release/bioc/html/intansv.html

反正我只会用了软件,会跑流程,至于结果怎么看,我真心不懂,还需要持续学习,估计等过了100讲,我会推出SV的续集,敬请期待~

这个,就后续再介绍咯!

文:Jimmy

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-03-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏算法修养

HDU-4539郑厂长系列故事——排兵布阵(状态压缩,动态规划)

郑厂长系列故事——排兵布阵 Time Limit : 10000/5000ms (Java/Other) Memory Limit : 65535/3276...

3505
来自专栏TensorFlow从0到N

点亮深度学习工作站

终于赶在2017年结束前,点亮了我的深度学习工作站。 ? 小核武.jpg ? ? 配置表 配件 型号 价格 数量 合计 GPU 微星 GTX 10...

3759
来自专栏非典型技术宅

iOS传感器:实现一个随屏幕旋转的图片1. 加速计介绍2. 加速计的使用3. 获取加速计数据的两种方式4. 实现图片永远水平方向

1574
来自专栏小白课代表

学术 | SCI论文下载

SCI(Scientific Citation Index)是美国科学信息研究所(ISI) 编辑出版的引文索引类刊物,创刊于1964年。分印刷版、光盘版和联机板...

491
来自专栏生信技能树

生信菜鸟团博客2周年精选文章集(4)NCBI数据库的几个探索

目录如下: 生信人必学ftp站点之NCBI-GEO 脚本作业-解读NCBI的ftp里面关于人的一些基因信息 NCBI的taxid简单介绍 NCBI的基因entr...

3658
来自专栏机器人网

为什么采用4~20mA的电流来传输模拟量?

大家可能会非常熟悉RS232,RS485,CAN等工业上常用的总线,他们都是传输数字信号的方式。那么,我们用什么方式来传输模拟信号呢?工业上普遍需要测量各类非电...

2628
来自专栏生信宝典

生物信息学数据库分类概览 (第一版)

生物与计算机的结合让生物进入大数据时代,为方便管理各种生物数据,科学家们开发了各式各样的生物数据库。了解与自己研究领域相关的数据库,并加以利用可能会使研究工作得...

2703
来自专栏应兆康的专栏

计算机网络笔记 —— 物理层 2

让多个用户共享同一根信道,复用技术是干线上的技术,主要问题在于干线起点如何共用,干线终点如何分离的。

681
来自专栏龙行天下CSIEM

科学瞎想系列之八十一 永磁电机(4)

【图片部分来自网络如有侵权敬请邮箱联系。欢迎原文转发到朋友圈,未经许可的媒体平台谢绝转载,如需转载或合作请邮件联系。联系邮箱laolicsiem@126.com...

922
来自专栏龙行天下CSIEM

科学瞎想系列之八十 永磁电机(3)

【图片部分来自网络如有侵权敬请邮箱联系。欢迎原文转发到朋友圈,未经许可的媒体平台谢绝转载,如需转载或合作请邮件联系。联系邮箱laolicsiem@126.co...

1294

扫码关注云+社区