今天有人问我,自己在两个公司对一批样本分别测了序得到OTU表,要怎么合并OTU表做后续的分析。
这个问题之前也有几个人问过,现在看来遇到这个问题的人也不少,本文简单回答一下,并给出我的建议。
首先,不管是不是同一测序公司,事实上任何两个OTU表不可以直接合并!原因很简单,两个OTU表中的每个OTU都不一定对应的是一个物种。这里面又包含几个因素:
1. 嵌合体的识别与去除,每次运行会有微小的差别。
2. 由于Uparse 算法本身比较宽松,每次运行得到的OTU表本身也会有微小的差异。其余的算法类似。
3. 每个OTU代表序列的选择可能也会有差别。
这就导致了同一个fasta文件跑两次Uparse,结果不会完全相同,而且数据量越大差异也会越大。
因此OTU表直接合并是没有意义的,必须跟公司要两次的fasta文件合并,之后再得到OTU。
建议
可能一批数据在公司测了好几次,我的建议是不要合并fasta文件得到OTU之后就进行分析。
首先应该做的是考察一下不同批次之间是否已经存在了较大的差异。
可以将不同批次之间进行分组先做一下PCA或DCA,看批次之间是否明显的分开。
如果分开的很明显,那就说明样本本身可能已经发生了变化;或者是公司的建库、测序平台等因素对结果影响很大。测序结果一定要慎用!
建议再测一次~
领取专属 10元无门槛券
私享最新 技术干货