专栏首页生信修炼手册使用ASProfile分析可变剪切事件

使用ASProfile分析可变剪切事件

欢迎关注”生信修炼手册”!

ASprofile是一款识别可变剪切事件的软件,该软件可以直接将同一个基因的多个转录本进行比较,从而鉴定可变剪切事件,官网如下

https://ccb.jhu.edu/software/ASprofile/index.shtml

该软件安装比较简单,下载解压缩即可。基本用法如下

extract-as  \
transcript.gtf \
ref.fa.hdrs > as_events.txt

该脚本需要两个参数,第一个参数为转录本对应的gtf文件,在实际分析时,首先利用cufflinks或者stringTie从测序数据中组装到转录本序列,然后将组装的转录本与已知的转录本合并去冗余,用merge之后的非冗余转录本序列作为输入;第二个参数为基因组长度统计文件,后缀为hdrs, 内容如下

>chr1 /len=249250621 /nonNlen=225280621 /org=Homo_Sapiens(hg19)
>chr2 /len=243199373 /nonNlen=238204518 /org=Homo_Sapiens(hg19)
>chr3 /len=198022430 /nonNlen=194797135 /org=Homo_Sapiens(hg19)

每一行代表一条染色体,分别给出总长度,去除N碱基之后的长度以及物种信息。最后生成的文件中会给出不同可变剪切事件的详细结果。Asprofile中的可变剪切类型定义如下

1. 外显子跳跃

外显子跳跃的定义如下

分别用onoff表示发生了外显子跳跃前后的转录本,X前缀表示外显子的边界非精确配对,和之前的exon相比,差了几个bp。

单个外显子跳跃称之为exon skipping, 用SKIP表示,示意如下

多个外显子跳跃称之为cassette exons, 用MSKIP表示, 示意如下

2. 内含子保留

内含子保留的定义如下

分别用offon表示发生内含子保留前后的转录本,X前缀表示外显子的边界非精确配对,和之前的exon相比,差了几个bp。

单个内含子保留称之为retention of single intron, 用IR表示,示意如下

多个内含子保留称之为retention of multiple introns,用MIR表示,示意如下

3. 外显子替换

外显子替换称之为alternative exon, 用AE表示,示意如下

包含各种情况,比如exon的5’端不变,3’端发生变化,示意如下

exon的3’端不变,5’端发生变化,示意如下

exon的3’端和5’端同时发生变化,示意如下

4. 转录起始位点的替换

转录起始位点的替换称之为alternative transcript start, 用TSS表示,示意如下

5. 转录终止位点的替换

转录起始位点的替换称之为alternative transcript termination, 用TTS表示,和TSS类似,只不过是3’末端位置发生了改变,示意如下

上述文件中可变剪切事件是以转录本为单位进行展示的,每行代表一个转录本,存在冗余,当我们想要知道某个基因上发生的可变剪切的类型和数量时,该文件就不够直观,官方提供了summarize_as.pl脚本,可以方便的得到非冗余的可变剪切事件以及每个基因可变剪切事件的汇总信息,用法如下

perl summarize_as.pl  \
transcript.gtf \
as.events.txt \
-p prefix

该脚本会生成两个文件,后缀为nr的文件中,是非冗余的可变剪切事件;后缀为summary的文件中是每个基因可变剪切的类型统计,示意如下

通过Asprofile, 可以直接对同一个基因的多个转录本进行比较,从而鉴别不同的可变剪切事件,除此之外,Asprofile还提供了定量的功能, 可以计算fpkm值,通过collect_fpkm.pl脚本可以汇总多个样本的可变剪切结果,用法如下

perl collect_fpkm.pl sampleA.AS,sampleB.AS -s txt

多个样本用逗号连接,-s指定对应文件的后缀,通过样本名字加后缀识别对应的文件。该脚本会给出每个可变剪切事件在样本中的比例,基于这个比例我们可以进行差异分析。更多用法请参考官方说明和脚本的帮助文档。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian),作者:lzyg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-11-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 揭秘可变剪切研究的本质

    可变剪切指的是一个基因由于剪切方式的不同从而产生了不同的转录本,很多人对于可变剪切的研究有很多的困惑,比如有没有现成的软件可以研究单个样本中的可变剪切事件,多组...

    生信修炼手册
  • 可变剪切的意义和重要性

    可变剪切differential splicing,也叫做选择性剪切alternative splicing, 指的是在mRNA前体到成熟mRNA的过程当中,不...

    生信修炼手册
  • 使用rmats进行可变剪切的分析

    rmats是目前使用的最广泛的可变剪切分析软件,该软件不仅可以识别可变剪切事件,还提供了定量和组间差异分析的功能,功能强大,网站链接如下

    生信修炼手册
  • C#开发BIMFACE系列25 服务端API之获取模型数据10:获取楼层对应面积分区列表

    在《C#开发BIMFACE系列22 服务端API之获取模型数据7:获取多个模型的楼层信息》中,返回的楼层信息结果中包含了楼层的具体信息,其中包含楼层ID。

    张传宁老师
  • [设计模式]之十:组合模式

    将对象组合成树形结构以表示“部分-整体”的层次结构。组合模式使得用户对单个对象和组合对象的使用具有一致性。

    wOw
  • Jfinal QuartzPlugin 简单使用案例

    之前一直使用spring quartz感觉还挺好用的,就想着jfinal是不是也可以使用quartz插件,于是发现了QuartzPlugin和jfinal-sc...

    大道七哥
  • Windows/linux下批量修改文件名方法

    rename命令可以用于批量修改文件名,在windows以及linux下都适用。windows下比较简单。且听娓娓道来。 首先你需要cd到你需要修改的那个文件...

    浩Coding
  • 【python】动态加载文件

    在项目中需要完成一个功能,用户在前端编辑代码,然后在用例中通用特定的方式(@{关键字方法}@)可以调用编辑的代码块 因为后台是一个服务,服务启动的时候加载生...

    py3study
  • Oracle 11g 安装教程

    最近学习Oracle,所以在Vm中配置一个win10的虚拟机来安装Oracle 11g,平时实验报告使用在虚拟机中使用SqlPlus,日常开发使用NaviCa...

    李郑
  • MultiRow发现之旅(一)- 高效模板设计器

    在这篇博客中我将向大家介绍一个集成在VisualStudio中的很酷很给力的设计器——MultiRow模板设计器。它与VisualStudio无缝集成,提供与V...

    葡萄城控件

扫码关注云+社区

领取腾讯云代金券