前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >你凭啥写“该基因在人体中高表达”--谁给你的勇气,梁静茹吗?

你凭啥写“该基因在人体中高表达”--谁给你的勇气,梁静茹吗?

作者头像
生信技能树
发布2018-12-12 16:37:56
2K0
发布2018-12-12 16:37:56
举报
文章被收录于专栏:生信技能树生信技能树

摸着你的良心,你有没有在文章的introduction里面煞有介事的介绍过某基因,你写“xxx基因是在人体中分布广泛、高表达且高保守的基因/蛋白,主要参与XXX等生物学过程”,套路,都是套路!

小编曾经也没头脑的写过这样的话,如今开始学了生信,好奇心就愈发控制不住了,那么我们到底凭什么才能明目张胆的下结论,认为一个基因是高丰度的呢?

今天以以下这篇有趣的文章为因子,我们来探索一下判定基因丰度的方法吧!

小声比比,这篇文章非常精彩哦~你是不是做过很多实验结果和主流的研究结果是矛盾的,做出来的结论和CNS文章的结论相反(泪流满面)

一直以来,大多数文献都报道MALAT1是一个促癌基因,而作者做出了相反结果,在一顿研究之后发现了之前报道文章的不妥之处,经过精心设计后,得到了一个圆满的答案。MALAT1其实是一个抑癌基因,前人使用的小鼠MALAT1缺陷模型,虽然MALAT1的表达缺失了,但MALAT1相邻基因的表达上调,正是这 上调的MALAT1相邻基因造成了促癌的后果。在更换新的MALAT1缺陷模型后,解开了MALAT1功能的面纱。

基因数据库

NCBI

凡是涉及到基因相关信息,我们就会想到各式各样的基因数据库,一说到基因数据库就会忍不住想到NCBI,是的没错,我们打开NCBI查一查吧!结果如图:

MALAT1在人体不同组织中的表达,横坐标为sample,纵坐标为RPKM:RPKM是Reads Per Kilobase per Million mapped reads的缩写,代表每百万reads中来自于某基因每千碱基长度的reads数。RPKM是将map到基因的read数除以map到基因组上的所有read数(以million为单位)与RNA的长度(以KB为单位)。

假如reads长度是150 bp,测序深度30X,按照(30亿*30X的深度/150reads长度)=可得6亿条reads,那么根据图可知emm...这个MALAT1的每百万条reads里就有5-150条有MALAT1(Jimmy说RPKM到达100就算是高的了)。

NIH-GTEX

GTEx是一个收录正常人体组织的测序结果的基因数据库。搜索MALAT1后结果如下,可见MALAT1在正常人体组织中的TPM(Transcripts per million)是非常高。

GeneCards®: The Human Gene Database

GeneCards类似于各大基因数据库的搜索引擎和总结。搜索MALAT1--转到Expression section后结果如下:

如图可知MALAT1的RNAseq数据,其FPKM (Fragments Per Kilobase Million)含量也是非常高的。

综上所述,从三个基因数据库查阅得知,MALAT1确实是一个高丰度且分布广泛的基因。

只不过,RPKM、TPM、FPKM三个单位是不是让你傻傻分不清楚这是啥玩意儿,没错我也很好奇,所以狠狠的撸了一把StatQuest的教学视频,想要了解的小伙伴,留言让我知道~那我们还可以出一波RPKM、TPM、FPKM解说推文~~

好了,掌握了基因丰度查阅的方法,再撸一把RPKM、TPM、FPKM的含义,终于可以吹牛打草稿了~拜拜~~

1

END

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档