首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

如何快速从基因组中提取基因、转录本、蛋白、启动子、非编码序列?

安装提取工具gffread 这里用到了gffread (https://github.com/gpertea/gffread),安装方式如下 (若不理解,见这个为生信学习打造的开源Linux教程真香的软件安装部分...): git clone https://github.com/gpertea/gffread cd gffread make release 提取转录本序列、CDS和蛋白序列 gffread -h可以参考所有可用参数...1.获取转录本序列 gffread GRCh38.gtf -g GRCh38.fa -w GRCh38.transcripts.fa 内容如下: head GRCh38.transcripts.fa >...ENST00000382398 ATGAAGTCCCTACTGTTCACCCTTGCAGTTTTTATGCTCCTGGCCCAATTGGTCTCAGGTAATTGGTATG 3.获取蛋白序列 # 获取蛋白序列 gffread...unprocessed_pseudogene 我们只筛选lincRNA grep 'transcript_biotype "lincRNA"' GRCh38.gtf >GRCh38.lincRNA.gtf gffread

3K10
领券