1. 测序数据质量评估
PEreads拼接:使用FLASHv1.2.7软件,按照最小overlap长度为10bp,overlap区允许的最大错配比率为0.2,对每个样品的reads进行拼接,得到的拼接序列即原始Tags数据(RawTags);
Tags过滤:使用Trimmomaticv0.33软件,对拼接得到的RawTags进行过滤,参数为设置50bp的窗口,如果窗口内的平均质量值低于20,从窗口开始截去后端碱基,过滤质控后长度小于Tags长度75%的Tags,得到高质量的Tags数据;
去除嵌合体:使用UCHIMEv4.2软件,鉴定并去除嵌合体序列,得到最终有效数据(EffectiveTags)。
嵌合体是由连接在一起的两个或更多个生物序列组成的序列,大部分被认为是在PCR过程中由于不完整的扩增而产生。
OTU聚类和注释
OTU(operationaltaxonomicunits)为了便于分析,人为给某一个分类单元设置的同一标志。通常按照97%的相似性阈值将序列划分为不同的OTU。
通过OTU分析,就可以知道样品中的微生物多样性和不同微生物的丰度。同时通过OTU的稀有度分析,还可以看出测序量是否足够反应样品中的大部分微生物种。
2. OTU注释
2.1物种注释数据库
2.2物种注释结果图
将每个OTU代表性序列比对到Silva数据库,对每个OTU进行物种归类,统计每个样品注释到各类水平上的序列数目。分类水平:界(Kingdom),门(Phylum),纲(Class),目(Order),科(Family),属(Genus),种(Genus)。
2.3物种注释结果统计
各样品中优势物种;
各样品中优势物种丰度;
组间微生物丰度变化趋势。
Others:丰度低于阈值的物种的总和;
Unclassfied:未被研究的物种。
2.4 heatmap图
Heatmap是以颜色梯度来代表数据矩阵中数值的大小并根据物种或样品丰度相 似性进行聚类的一种图形展示方式。将高丰度和低丰度的物种分块聚集,通过颜色梯度及相似程度来反映多个样品群落组成的相似性和差异性。
通过颜色梯度及相似程度来反映多个样品群落组成的相似性和差异性;
纵向聚类表示不同物种在各样品间丰度的相似情况;
横向聚类表示不同样品的各物种丰度的相似情况。
2.5OTU系统进化树
共分为三层,最里面一层是OTU系统发育树;第二层是OTU相对丰度;第三层是注释可信度。
挑选出属分类学水平上丰度最高的OTU的序列作为代表序列,进行多重序列比对并使用邻接法(Neighbor-Joining)构建系统进化树;
进化树中每条树枝代表一个物种,树枝长度为两个物种间的进化距离,即物种的差异程度。
环形图为物种进化树,相同颜色属名代表所属于相同的门。
2.6MEGAN分类学树状
①单样品分类学树状图中不同的层次反映NCBI不同的分类学水平;分支处的圆面积代表了分布在该分类学水平且无法继续往下级水平比对的序列数量,面积越大,说明此类序列越多。
②多样品分类学树状图比对不同组或样品在某分支上的序列丰度差异,不同的颜色代表不同组或样品,某颜色的扇形面积越大,说明在该分支上,其对应组或样品的序列数比其他组或样品多。
2.7 OTU网络图:反应样本与物种间的相关性
基于样本间OTU的相对丰度进行相关性分析,展示哪些OTU在哪些样本(组)中显著富集;或是一个样品中不同OTU之间的相互关系。每一个圆圈代表一个物种,不同颜色表示不同的样本;哪些OTU在哪些样本中富集;不同OTU之间的相关性,实线代表正相关,虚线代表负相关。
领取专属 10元无门槛券
私享最新 技术干货