前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何获得FPKM/RPKM计算需要的基因长度(考虑exon之间的overlap)

如何获得FPKM/RPKM计算需要的基因长度(考虑exon之间的overlap)

作者头像
用户1680321
发布2020-03-20 16:35:35
3.3K1
发布2020-03-20 16:35:35
举报
文章被收录于专栏:yw的数据分析

版权声明:本文为博主原创文章,转载请注明出处

这里我们跟Cufflinks的原理一致,使用总的外显子长度,并且去除过多的重叠的外显子的部分。使用R语言,输入为基因的GTF文件

包的安装

依赖data.table, IRanges,rtracklayer

代码语言:javascript
复制
install.packages("data.table")
if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("rtracklayer")
BiocManager::install("IRanges")
代码
代码语言:javascript
复制
library(data.table)
library("IRanges")
require("rtracklayer")

hg19 <- readGFF("hg19.gencodev27.gtf")
anno <- setDT(hg19)
anno <- anno[type=="exon",]
setnames(anno,c("seqid","start","end","gene_name","exon_number"),c("Chr","ExonStart","ExonEnd","Gene","Exon_number"))
#mkdir bin and mean by bin
Exon_region <- unique(anno[,.(Chr,ExonStart,ExonEnd,Exon_number,Gene)])
Exon_region <- Exon_region[,{x <- IRanges(ExonStart,ExonEnd);y <- reduce(x); list(ExonStart=y@start,ExonEnd=y@start+y@width-1)},by=.(Gene,Chr)]
Exon_region[,Exon_num:=1:.N,by=Gene]
Exon_region <- Exon_region[,.(Chr,ExonStart,ExonEnd,Exon_num,Gene)]
Exon_len <- Exon_region[,.(ExonLen = ExonEnd - ExonStart + 1),by=.(Exon_num,Gene)]
gene_len <- Exon_len[,.(Length = sum(ExonLen)),by=Gene]


# write out
fwrite(Exon_region,file="All_hg19gene_exon.bed", sep = "\t", col.names = T)
fwrite(gene_len, file = "All_hg19gene_len.txt", sep = "\t", col.names = T)
~
结果文件
  1. 基因长度文件 链接:https://pan.baidu.com/s/1NtfM_ESyNyaT-kVaKu0MyQ 提取码:gy88 复制这段内容后打开百度网盘手机App,操作更方便哦
  2. 合并后的外显子区域文件 链接:https://pan.baidu.com/s/1-IpuC_2N88Jx9m2g5fCqmA 提取码:cevo 复制这段内容后打开百度网盘手机App,操作更方便哦
参考资料

https://www.cureffi.org/2013/09/12/counts-vs-fpkms-in-rna-seq/

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-03-19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 包的安装
  • 代码
  • 结果文件
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档