作者:赵维 中国科学院天津工业生物技术研究所
审稿:刘永鑫 中国科学院遗传与发育生物学研究所
关于LEfSe分析,相信大家早已耳熟能详。网上也有很多指导如何做LEfSe分析流程的文章。可是在实际应用中,仍然会遇到一些问题。LEfSe以出图美观的优势吸引大家用它绘图,然而为什么同样的流程,我们做出来的图总是不如别人发在文章里的漂亮?比如,别人发表的图是这样的:
图1 Least discriminant analysis (LDA) effect size taxonomic cladogram comparing all samples categorized by four bacterial provinces.引自Wang Kai, Environmental Microbiology, 2015
而我做的图是这样的:
图2 我做的cladogram图
下面就来告诉大家如何将图二美化成图一的样子:
首先,观察第一张图,仔细观察后发现该图漂亮的原因是作者只保留了具有显著差异的分类单元分支,而将无差异点(黄色)进行了过滤去除。
在一般流程下基于LEfSe分析获得的树图分支过多,主要由无差异点(黄色)造成。
于是,提示我们可以从LEfSe流程分析的中间文件.lefse_internal_res入手进行编辑:
将LEfSe分析第二步(LDA Effect Size)的结果文件Galaxy12-[B)LDA_Effect_Size(LEfSe)_on_data_11].lefse_internal_res下载下来,使用notepad编辑器打开,该文件记录了每一个分类单元在各组的统计差异显著性结果,打开如下:
我们要做的就是将其中具有显著差异的微生物挑选出来,以每一个差异分类单元为一行,单独制作成一个文件,这需要用到notepad的编辑功能: 首先,使用notepad的查找-标记,将差异显著的单元行进行标记;
然后,删除未标记行;
最后,将编辑好的文件保存,并再次上传至LefSe网站,注意上传文件格式type选择lefse_internal_res;
上传后,在分析界面直接选择Plot_Cladogram绘图即可。
按照上述步骤,我们一开始的(图2)分析结果,经优化后如下:
优化后的cladogram图减少了无差异的分类单元的出现,增大了差异微生物的扇面区,结果更加清晰美观。大家可以通过在线设置进一步调整图片的字体、大小等。
LEfSe官网:http://huttenhower.org/galaxy/