专栏首页生信技能树有趣的基因命名

有趣的基因命名

gene symbol 是非常官方的,由HUGO 组织负责维护,有专门的数据库HGNC database of human gene names | HUGO

以前分析数据的时候,有一些基因的symbol很奇怪,让我百思不得其解,比如:

  • C orf 系列基因,
  • HS.系列基因,
  • KRTAP系列基因,
  • LOC系列基因,
  • MIR系列基因,
  • LINC系列基因

它们往往一个系列,就有好几百个基因,

  • C12orf44; Chromosome 12 Open Reading Frame 44; 这个是C orf系列基因的意思
  • MIR系列基因应该是 miRNA相关的基因
  • LINC系列基因应该就是long intergenic non-protein coding RNA
  • OC系列基因,是非正式的,推定的,日后可能被更合适的名字替代

还有一些RNA基因,根本就没有symbol,比如:CTA/B/C/D-系列的

  • Aliases for ENSG00000271971 Gene
  • CTD-2006H14.2 5
  • External Ids for ENSG00000271971 Gene
  • Ensembl: ENSG00000271971

还有,如果你看到HS.开头的基因,它是unigene的ID了,已经不再是symbol啦。

当然了,本来就有很多基因家族里面的成员的名字就很类似,也可以理解哈。

关于非编码蛋白的基因

如果有一个很接近的蛋白编码基因,lncRNA的名字应该以这个编码基因名字开始,然后制定以后后缀,这个后缀可以下方式分类: ● 反义 (antisense,AS),BACE1-AS; ● 内含子(intronic,IT),例如,SPRY4-IT1; ● 重叠 (overlapping,OT),例如,OSX2-OT; ● 长链基因间lncRNA(Long intergenic lncRNAs,lincRNAs),以LINC为前缀,数字为后缀,例如LINC00485。

上述命名的基本架构适用于大多数lncRNA,但对于基因密集区域的lncRNA可能就不适用了,这种情况下,你应该与HGNC沟通来解决。

关于Excel表格的日期基因

当然了,如果你是Excel表格操作,你还有可能遇到日期基因

image-20191129123404482

具体见:Excel-坑你的基因名没商量!-计算机基础-生信技能树 www.biotrainee.com/thread-908-1-1

本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 惊!3个同样的数据挖掘策略居然同时发表

    这个问题怎么说呢,生命科学领域的数据挖掘课题的发表主要是靠工作量,很少有新颖或者前沿,无非就是替换癌症替换分子替换生物学功能基因集,我整理过大家耳熟能详的策略,...

    生信技能树
  • 为什么要学习编程?

    帮同学处理一下他从公司拿到的差异分析结果,当然,给我的是Excel表格,老规矩,导出csv然后读入R,然后准备顺手画个火山图,做个GO/KEGG富集分析。下意识...

    生信技能树
  • 听说Excel表格动了你的基因名?

    帮同学处理一下他从公司拿到的差异分析结果,当然,给我的是Excel表格,老规矩,导出csv然后读入R,然后准备顺手画个火山图,PCA图,热图,做个GO/KEGG...

    生信技能树
  • Cytoscape插件3:Enrichment Map(1)

    早期的基因列表解释依赖于选择一系列高得分的基因,然后建立相当主观奇怪的关系。富集分析是一个自动的,基于严格的统计学的方法来分析和解释很大的基因列表,使用的是先验...

    Y大宽
  • 文献翻译:Statistical Approaches for Gene Selection, Hub Gene Identification and Module Interaction in...

    信息基因的选择是基因表达研究中的重要问题。基因表达数据的小样本量和大量基因特性使选择过程复杂化。此外,所选择的信息基因可以作为基因共表达网络分析的重要输入。此外...

    用户1359560
  • 这些基因的名字太有才了,研究一下都可以发10分文章

    2019/10/03 修改版:这篇刚发的时候,评论里有老师补充了3个fun gene names,这次添加在了文末的表格中。时间一直在走,一个月,六个月,十年,...

    生信宝典
  • 只聚焦一个基因如何进行下一步研究?

    之前有小伙伴提问说,老板只给了一个基因让在胃癌当中研究。组内的测序数据也不让用,想要往下做一些和这个基因有关的基础实验,这个该怎么弄呢?

    科研菌
  • 核心基因筛选:基于EXCEL

    昨天我们介绍了利用STRING数据库来进行蛋白相互作用预测(STRING:蛋白相互作用数据库的使用),但是我们只是获得了相互作用网络分析的数据以及可以使用的相关...

    医学数据库百科
  • 非肿瘤单基因纯生信文章如何发3分+

    大家好,今天和大家分享的是今年3月份发表在Shock(IF:3.083)的一篇非肿瘤生信文章,“S1PR1-associated Molecular Signa...

    百味科研芝士
  • 南大领衔!国内高校团队登上美国《科学进展》杂志,发布基因编辑可控技术

    具体来看,在最新新一期美国《科学进展》杂志上,这个团队发布了一篇极为重要的论文,核心就是团队开发出了一种基因编辑技术工具的新型载体,能够实现基因编辑可控,显著提...

    镁客网

扫码关注云+社区

领取腾讯云代金券