真核生物的基因大都为断裂基因,编码序列通常被内含子隔开。内含子和外显子边界和周围序列是前体mRNA内的有保守性的一些特殊核苷酸序列。
内含子的5'端剪切位点以GU开始,叫donor 内含子的3'端剪切位点以AG结束,叫acceptor, 还包括位于内含子内,靠近3'端的分支位点,通常为A,后面是多聚嘧啶区
在分析基因组数据时,通常需要预测基因的RNA选择性剪切方式,也就是内含子和外显子的位置和数量。 而基于的就是RNA剪接的保守型序列GU-AG规则,据此,再辅以ORF,Blast等数据可以对未知基因的成熟mRNA进行预测。
或者
image.png
image.png
详细请参考https://www.ncbi.nlm.nih.gov/sutils/splign/splign.cgi?textpage=documentation
image.png
image.png