序列比对的系列文章第二部分主要介绍了HMM(隐马尔科夫模型),包含了八篇文章:
《序列比对(15)EM算法以及Baum-Welch算法的推导》
HMM模型最关键的一点就是在一个状态序列中,某一步状态的概率只与上一步的状态有关。也正是因为与前面一步状态有关,所以HMM模型天然地适用动态规划算法。
一、如何随机生成状态序列和符号序列:
二、Viterbi算法求解最可能路径
三、前向算法和后向算法计算符号序列的全概率
四、后验概率的计算与后验解码
五、Baum-Welch算法估算HMM模型参数
伪计数之和反映了我们认为先验知识的可靠程度。如果伪计数之和较大,则我们认为先验概率比较可靠,需要用更多的数据取改变它。反之不太可靠。
最开始的概率参数可以用随机数。只要保证相应的概率和为1即可。
至此,序列比对系列文章已经介绍了“第一部分:二序列比对的常见问题和相应算法”以及“第二部分:HMM模型及相关算法简介”。在学习“将HMM模型应用到序列比对(或序列发现)”之前,我们接下来准备先学习一下多序列比对的常见问题和相关算法。