前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用seqLogo可视化motif

使用seqLogo可视化motif

作者头像
生信修炼手册
发布2019-12-19 15:49:12
9860
发布2019-12-19 15:49:12
举报
文章被收录于专栏:生信修炼手册

欢迎关注”生信修炼手册”!

seqLogo是一个bioconductor上的R包,专门用于DNA序列的motif可视化,网址如下

https://www.bioconductor.org/packages/release/bioc/html/seqLogo.html

因为功能的单一性,所以其用法也特别的简单,只需要输入motif对应的PPM矩阵就可以了,下面通过一个实际例子来看下

上图为一个motif的PFM矩阵,只需要通过以下几个步骤就可以得到对应的sequence logo。

1. 读取PFM矩阵

将PFM矩阵保存在一个文件pfm.txt中,内容如下

注意PFM矩阵中规定碱基顺序为ACGT, 不能任意调换碱基的顺序。通过R语言来读取,代码如下

代码语言:javascript
复制
data <- read.table("pfm.txt", header = F, sep = "\t", row.names = 1)
2. 生成PPM矩阵

PPM矩阵就是将PFM矩阵中的频数转化成频率,除以每列的总和就可以了, 代码如下

代码语言:javascript
复制
ppm <- sapply(1:ncol(data), function(t){ data[[t]] / sum(data[[t]]) })

ppm的内容如下

因为行的顺序统一为ACGT, 所以我们不需要设置行名称。

3. 绘图

基本用法如下

代码语言:javascript
复制
p <- makePWM(ppm)
seqLogo(p)

输出结果示意如下

相比其他工具,这个R包的功能较为单一,存在无法调整配色方案等问题,但是作为一个可视化工具,其足够简单,已经能满足基本要求。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-04-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 读取PFM矩阵
  • 2. 生成PPM矩阵
  • 3. 绘图
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档