【直播】我的基因组80:为什么有些基因的内部测序深度差异如此大

这一讲里,我们依旧根据统计的基因测序的深度进行一下讨论,来看看为什么有些基因的内部测序深度差异如此大?

在前面我们的计算中,s列表示的是基因的每一个坐标的测序深度的方差,所以代表着基因的内部测序深度差异值。

在正常WGS中,每个基因的各个部分测序深度应该趋近于一致,可以形成一条直线。但是如果基因太长,内部GC含量不一致,那么每个基因的各部分测序深度可能就不一样了,而且有些基因可能是部分序列重复,这样的话这个部分序列就会被超量测序。不过,基因内部的部分缺失不会反应在S值里面,因为没有计算那些未被覆盖的基因区域。

对于前面的分析结果,我们可以简单的画一下s值跟基因的平均测序深度,基因长度,GC含量的关系,如下:

可以看到基因的S值(基因的内部测序深度差异)跟基因长度是没有关系的,这个很容易理解,因为S是方差,在公式里面本身摈弃了基因长度的影响。

但是S值跟测序深度和GC含量的关系,我只能画在这里,并不知道如何去解读。

而且这个图做的不好,应该对那些点加上透明度,尤其是0~200这个S值之间的点太过集中了。

接下来,我们简单看一下,S最大的基因是哪些吧,然后我们再一一解读:

MUC3A前面测序深度那一讲我就说了,这里就略过哈。它的问题反正在于,家族基因不清不楚。而且它的GC含量也太低了一点!!!

再排除几个覆盖度不够的基因,那么只剩下TMEM242 基因啦,它的英文介绍如下:

TMEM242 gene (Protein Coding), Transmembrane Protein 242

The C6orf35 protein has a conserved domain of unknown function pfam 07096, DUF 1358., which covers the first 121 aa of the protein. This domain is conserved in eukaryotes.

这个基因以前叫做C6orf35,这个名字我在论坛说过几次啦。在我的这次WGS数据里面,它的平均测序深度并不算太高,就77X而已,GC含量也不是太离谱,56.6%。为什么基因上面每个坐标的测序深度的差异性那么大呢?我在IGV里面定位到了它,仔细一瞧,有一个片段测序深度高达1000~2000,好可怕~~~~

然后看了看NGB这个基因,也是同样的问题,就是局部片段测序深度高的不正常,我可能需要再查查资料才能明白到底是什么原因。

(NGB)This gene encodes an oxygen-binding protein that is distantly related to members of the globin gene family. It is highly conserved among other vertebrates. It is expressed in the central and peripheral nervous system where it may be involved in increasing oxygen availability and providing protection under hypoxic/ischemic conditions.

除了了有基因的内部测序深度差异非常大的,还有一些基因内部测序深度基本没有差别的,比如下面几个基因,首先它们的基因长度都很短,这样的话,一个PE的reads就把它们给覆盖完了,整个基因的所有坐标都在同一堆reads上面,那么内部差异想大也打不起来了哦。

在于那些基因的内部测序深度差异如此大的基因,基因长度就没那么重要了,可能是基因内部GC含量非常的不平衡或者其它,这就需要进一步的分析了。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-05-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏张善友的专栏

弹出式模态窗体选择文本控件

2006年就要到来了,最近比较忙,很少更新blog,今天发一个模态窗体选择文本控件辞旧迎新.新年在发几个asp.net2.0 webPart控件同各位分享: ...

1907
来自专栏自由而无用的灵魂的碎碎念

小项目分享---混色器

编写代码的同志们一般懂美术的就少了,偶也是,什么色轮、三维加色等等。虽然看过一些书籍(如内田广由纪的《配色基础原理》),不过还是一知半解的。

973
来自专栏Golang语言社区

GO语言 TCP传输实例

package main import ( "net" "fmt" ) var ( maxRead = 1100 msgStop = []byt...

3406
来自专栏菩提树下的杨过

基于sliverlight + wcf的web 文字版IM 示例

演示地址: http://task.24city.com/default.html 预览界面: ? 一、布局 采用Grid布局,5行2列 第一行:为登录/注册信...

3226
来自专栏c#开发者

about store RecordField submit emptystring issue

operate screenshot When click save button submit to change,trace store before...

3447
来自专栏大内老A

开发自己的Data Access Application Block[下篇]

上接:[原创] 我的ORM: 开发自己的Data Access Application Block - Part I 4. Database 下面来介绍重中之重...

2246
来自专栏菩提树下的杨过

Silverlight:利用异步加载Xap实现自定义loading效果

关键点: 1.利用WebClient的DownloadProgressChanged事件更新下载进度 2.下载完成后,分析Xap包的程序集Assembly信息 ...

18610
来自专栏码匠的流水账

zuul自定义SimpleHostRoutingFilter

zuul的SimpleHostRoutingFilter主要用来转发不走eureka的proxy,里头是使用httpclient来转发请求的,但是有时候我们需要...

1312
来自专栏james大数据架构

CSS好看的按钮

好看的按钮 <style> .btn { BORDER-RIGHT: #7b9ebd 1px solid; PADDING-RIGHT: 2px; BORDE...

2007
来自专栏跟着阿笨一起玩NET

treeview 绑定文件夹和文件

461

扫码关注云+社区