【直播】我的基因组48:我可能测了一个假的全基因组

背景知识

男性只有一条X染色体和一条Y染色体,所以,理论上它们上面的SNV都应该是纯合的! X,Y除了同源区域外,其它地方差异很大。所以在女性样本里面即使是混入了极低量的男性样本,也很容易检测出来。同理,男性样本里面混入了女性样本,会给男性带来大量的X染色体的杂合SNV,也很容易检测出来。

我的测序结果

我对前面步骤call到的vcf格式的变异位点文件进行了X,Y染色体的简单统计,代码如下:

cat  jmzeng.freebayes.vcf |grep -w 'chrY'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c
cat  jmzeng.freebayes.vcf |grep -w 'chrX'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c

结果不是很妙!

  • 按照道理,不管是X,Y染色体,我都只有一条呀!
  • 但是为什么我call出来的snp位点, 居然~~~这么多杂合的????
  • 尽管测序会有错误,不那么精准,但是误差不应该那么大吧!

我测试了另外一个软件call出来的snp位点,也用同样的脚本进行统计!

zcat jmzeng.bcftools.vcf.gz |grep -w 'chrX'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c
zcat jmzeng.bcftools.vcf.gz |grep -w 'chrY'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c

结果也不容乐观!

起初我怀疑是我的snv结果没有进行过滤,所以造成了这么大的误差,那么就用测序深度来进行过滤吧!

很明显,纯合杂合的问题,并没有测序深度的偏差,我暂时还不能确定问题出在哪里,接下来4篇帖子都会围绕着这个问题展开!

关于NGS数据探索性别相关问题,更多阅读,请自行前往我的博客搜索!

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-01-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SDNLAB

我与SDN的缘分:一名初学者的学习之路与心得

SDN,Software Defined Network,是对传统网络架构的一次革新。经过短短三四个月的学习和实践,我本着授人以渔的理念,辅以我的一些理解,将我...

2534
来自专栏烙馅饼喽的技术分享

我的CMS开发记-2 该ORM就ORM,该写SQL还是写SQL

     啊,是ORM还是SQL,这是个问题.      先扯段题外话,我原来公司的产品是java和.net共存,java部分是外包的,于是么各位也可想而知,两...

34610
来自专栏进击的程序猿

The Clean Architecture in PHP 读书笔记(一)

框架是非常好的,可以帮助我们快速的开发,但是前期的学习成本往往很高,特别是如果想要深入理解框架,需要花费大量的经历。

653
来自专栏Jackson0714

Web性能探索之旅-1.无线网络基础

2626
来自专栏腾讯大讲堂的专栏

1024丨腾讯第一首程序员之歌【Code代码】

“发布总是在半夜 回滚是永远的愁”。 内存泄漏、深夜发布、需求变更,这些熟悉的词语和场景,相信对于每个程序员朋友来说,都有着独特的记忆和感触,在此谨祝全天下的程...

2724
来自专栏学习圈

移动端通用优化方案

手机屏幕帧率一般为60 FPS,也就是说一帧的渲染时间为16.7ms,所以如果页面渲染时间超过16.7ms 容易出现卡顿现象。提高页面渲染效率可以考虑如下方法:

20311
来自专栏杨建荣的学习笔记

go语言学习初体验

我们暂时先抛开go语言,咱们说下行业里近两年的哪些技术发展最火,毫无疑问是Docker和Kubernetes,没错,他们是go语言的顶级项目。

982
来自专栏生信技能树

qualimap+multiqc完美解决多组学比对结果的质控

这个完全是项目实战经验分享咯,有大样本量NGS多组学数据处理经验的朋友应该能很容易理解,动辄几个T的数据,上百个样本很难一个个的检查是否出现问题,需要一个简单方...

964
来自专栏豆包的专栏

白夜追凶 :手 Q 图片的显示和发送逻辑

本文整理总结了手 q 中图片的显示和发送逻辑,以及对透明通道图片的特殊处理。

4612

在统一的分析平台上构建复杂的数据管道

在Quora上,大数据从业者经常会提出以下重复的问题:什么是数据工程(Data Engineering)? 如何成为一名数据科学家(Data Scientist...

1968

扫描关注云+社区