常见的数据库id介绍:http://www.biotrainee.com/thread-411-1-1.html
Ensembl ID的介绍:https://asia.ensembl.org/Help/Faq?id=488
ENS代表 Ensembl ID。默认物种是人,如果是小鼠就要用ENSMUS开头,物种代码:http://www.ensembl.org/info/genome/stable_ids/index.html 例如:小鼠
image.png
G表示:ID指向一个gene T表示:ID指向一个transcript 一个基因有多个对应的转录本 后面11位数字表示基因的编号,小数点ID的版本,数字几就是第几版,在分析时需要去除。 去除方法:
ann$gene_id<-factor(unlist(lapply(as.character(ann$V1),function(x){strsplit(x, "\\.")[[1]][1]})))
image.png
参考:https://www.jieandze1314.com/post/cnposts/ensembl-id/
欢迎关注微信公众号:生信编程日常