最近学习肠道微生物方面的知识,有一部分测序数据需要学习分析。鉴于qiime已经升级为qiime2,还有了图形版本,真是越来越人性化了,但是图形版本还处于原型阶段,测试安装两次以失败告终,可能是我的系统是deepin,通用性不好,如果在原生的ubuntu或许可以安装成功。话说qiime2已经在今年1月份代替qiime1成为官方支持版本,qiime1已经停止维护了,我表示对于我这种几乎没有qiime1使用经验的人来说,直接上手qiime2也不错。
我的理解中,qiime2最大的区别除了从python2进化到python3,还有一个新的数据格式qza,这又多了一步数据格式导入和转换的步骤。我想官方做出这一选择肯定是有他的道理的,应该是更易用了,毕竟都开始上图形界面了。
下面是我的pipeline学习笔记:
开始我参考的是微信公众号 统计咨询 的《肠道菌群研究 – 从生物信息分析开始(内含代码)》。但是发现样本表的文件名已经变成了样本文件所在文件夹名+mainifest,而我的文件名还是csv的。。。。。。ps.我的shell水平几乎没有,于是用python代替,虽然简单问题有点复杂化了。
获得的文件内容类似于:
2.导入数据
所说phred64的数据处理起来特别慢,要提前转换。这个过程一个单样本时间只花了几十秒大概。