前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言计算GC/AT含量

R语言计算GC/AT含量

作者头像
阿凡亮
发布2020-04-13 13:24:05
1.6K0
发布2020-04-13 13:24:05
举报
文章被收录于专栏:生物信息学生物信息学

大家晚上好,今天给大家介绍一个可以处理FASTA文件的包-Biostrings。这个包主要是处理基因组的一些序列信息,包括:序列翻译、DNA/RNA互转、统计各个碱基的含量、三连字母的含量.....这些都是一行命令可以解决的。今天就先来教大家怎样计算GC/AT含量。

首先是安装,代码如下:

代码语言:javascript
复制
source("http://bioconductor.org/biocLite.R")biocLite("Biostrings")

输入代码后需要耐心地等待几分钟。

安装完毕,只需敲几行代码,就可以实现GC/AT含量可视化。

代码语言:javascript
复制
#序列文件储存路径filepath<-"C:/Users/dell/Desktop/sequence.fasta"#读取文件(FASTA格式)x<-readDNAStringSet(filepath)chrom<-x[[1]]#每100个碱基为窗口计算AT含量at<-rowSums(letterFrequencyInSlidingView(chrom,100,c("A","T")))/100#获取描述性统计量根据此设置坐标summary(at)#画图plot(at,type='l',axes=F,xlab=NA,ylab=NA,ylim=c(0.2,0.8))axis(2,at=c(0.2,0.4,0.6,0.8),labels=c("20%","40%","60%","80%"))#纵坐标设置根据summary函数计算结果axis(1,at=c(0,2000,4000,6000,8000,10000,12000,14434),labels=c("Start","2000","4000","6000","8000","10000","12000","End"))#根据基因组显示横坐标信息

运行,结果如下:

END

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-11-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生物信息学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档