专栏首页科技记者QIIME2学习笔记(二)

QIIME2学习笔记(二)

1. 序列质控及Feature表构建

导入数据之后便是质控了。

这次不用测试数据了,用实际数据跑一下,所以同样重复之前的步骤,把fastq文件压缩下,然后,生成样本数据列表(ps.不知道fastq文件不压缩可不可以用,有空试下)。依然参考自上篇的统计咨询公众号的文章代码如下:

gzip *  #gzip压缩文件夹里所有的数据
source activate qiime2-2018.2 #激活qiime2环境
##1## import data
qiime tools import  \
--type 'SampleData[PairedEndSequencesWithQuality]'  \
--input-path 171213_16s-manifest  \
--output-path 171213_16s.qza  \
--source-format PairedEndFastqManifestPhred33
##2## quality control
#visualization
qiime demux summarize \
--i-data 171213_16s.qza\
--o-visualization 171213_16s.qzv
##3##filter 聚类
qiime dada2 denoise-paired \
--i-demultiplexed-seqs 171213_16s.qza \
--p-trunc-len-f 0 \
--p-trunc-len-r 0 \
--o-representative-sequences rep-seqs-dada2.qza \ #输出feature表代表序列
--o-table table-dada2.qza \ #输出表
--p-n-threads 36 #36线程,服务器是40线程的
#qzv 可视化
qiime feature-table summarize \
--i-table table-dada2.qza \
--o-visualization table-dada2.qzv

主要作用是去除低质量序列、嵌合体;再生成OTU表,现在叫Feature表,因为不再使用聚类方法,相当于QIIME时代100%相似度的OTU表。–QIIME2中文帮助文档(https://forum.qiime2.org/t/qiime2-chinese-manual/838)

2.导出数据

这里顺便学习一下导出数据,毕竟qiime2全部是专有格式的文件,不导出没办法在外部查看。到这里,没有中文的相关参考了,直接去学习qiime2官方文档。命令比较简单,就是qiime tools export 后面加上文件等参数就行了。

qiime tools export \
feature-table.qza \
--output-dir exported-feature-table

运行后导出了一个biom格式的文件。还是比较亲切的格式。

3.metadata 实验设计

文档介绍说类似于qiime1的mappingfile,只不过是tsv格式的,还兼容mapping文件的。文件长得这样:

这个文件对于我来说好你暂时没有用到,所以暂时没有创建,不知道后边会不会卡脖子,因为我用到的是分好的样品数据,没有进行分数据的步骤。

本文分享自微信公众号 - 科技记者(kejijizhe),作者:zd200572

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-04-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • qiime2-2018.11发布学习笔记

    1.qiime tools validate这个命令现在可以确认.qzv文件的有效性了,而且会进行md5值的校验。

    用户1075469
  • qiime2+picrust1学习笔记

    一直迷惑于如何把qiime2和picrust结合起来用来分析16S的数据,直到这两天,看到了微生太公众号的视频教程,才有了眉目,原来如此。详细视频教程可以查找相...

    用户1075469
  • ubiome类似数据dada2处理探索3

    我简单处理了下otu序列和表,使它们能导入qiime2,应该是一行shell代码解决的,shell水平不行,python来顶了。

    用户1075469
  • 【一起来烧脑】一步学会AngularJS系统

    AngularJS是一个JavaScript框架 一个用JavaScript编写的库

    达达前端
  • iOS开发:Xcode自带的模拟器常用快捷键的使用

    在iOS开发过程中,为了方便起见在测试程序的效果的时候,开发者会使用Xcode自带模拟器进行操作,而且Xcode自带的手机模拟器包含了苹果的所有最新的手机型号尺...

    三掌柜
  • JavaScript大师必须掌握的12个知识点

    为了保证可读性,本文采用意译而非直译。另外,本文版权归原作者所有,翻译仅用于学习。

    Fundebug
  • python 读取excel 生成jso

    # _*_ coding: utf-8 import xlrd,sys import pickle import json data=xlrd.ope...

    py3study
  • 第98天:CSS3中transform变换详解

    Transform字面上就是变形,改变的意思。在CSS3中transform主要包括以下几种:旋转rotate、扭曲skew、缩放scale和移动transla...

    半指温柔乐
  • 改进模型架构遇到了瓶颈?你该考虑改善自己的数据了!

    AI 科技评论按:这篇博客来自 Jetpac(现被谷歌收购) CTO、苹果毕业生、TensorFlow 团队成员 Pete Warden。文中讨论了一个很容易被...

    AI科技评论
  • gRPC遇见.NET SDK和Visual Studio:构建时自动生成编码

    作为微软向其跨平台.NET产品发展的一部分,他们大大简化了项目文件格式,并允许第三方代码生成器与.NET项目的紧密集成。我们一直倾听,现在很自豪地介绍从Grpc...

    CNCF

扫码关注云+社区

领取腾讯云代金券