专栏首页生信宝典人类微生物组计划 - 宏基因组/16S分析流程 bioBakery

人类微生物组计划 - 宏基因组/16S分析流程 bioBakery

bioBakery是NIH人类微生物组计划实施过程中开发的部分软件和使用教程的集合,主要由哈佛大学的Huttenhower实验室开发。提供了16S, 宏基因组宏转录组分析的全部流程,并可以生成结果报告。

其主要工具如下(可单独安装,也可打包安装):

这都是宏基因组和16S分析常用工具,软件使用请看宏基因组分析教程合集

biobakery安装

下面4中安装方式,按需选择。

  1. 使用conda一个个安装,Conda安装方法
  2. 使用Docker安装,docker run -it biobakery/workflows bashDocker使用教程
  3. 使用HomebrewLinuxbrew安装,brew install biobakery/biobakery/workflows
  4. 使用pip安装(部分依赖包需要手动安装),pip install biobakery_workflows

biobakery数据库安装

# To install the full shotgun databases:
biobakery_workflows_databases --install wmgx

# To install the full 16s databases:
biobakery_workflows_databases --install 16s

16S分析流程

# All input files are located in the folder input and all output files will be written to the folder output_data.

biobakery_workflows 16s --input input --output output_data

这个分析流程与我们的培训扩增子有参无参和功能分析主体类似,而且我们在这个基础上做了比较多的拓展,可以获得更多定制分析结果。本课程也有配套视频在腾讯课堂https://bioinfo.ke.qq.com/, 欢迎观看。

16S DADA2分析流程

宏基因组流程

软件流程网址

https://bitbucket.org/biobakery/biobakery/wiki/biobakery_workflows (后台回复 biobakery获取可点击的链接)

新一期的宏基因组课程开始了,2018年10月19-21日, 相约北京鼓楼,一起讨论宏基因组分析专题。内容涵盖这套流程,并且增加了无参宏基因组分析(bin)。

课程大纲

每节课1小时一个主题,理论结合实战,学懂原理,实战实操,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课,41为两周后的线上集中视频答疑。

编号

主题

简介

11

Linux基础

简介、远程登陆、文件传输、常用命令

12

Linux软件安装

Conda安装与配置,宏基因组相关软件安装

13

Win软件安装

git、R、Rstudio、R包、STAMP、AI等

14

图表解读

常用分析图表在文章中意义和使用场景

15

R基础

发展史、生物学中应用、ggplot2绘图

16

可视化

16种图表的数据整理和在线绘制

21

宏基因组简介

发展史、常用技术适用范围、分析思路

22

宏基因组有参质控

KneadData质控、parallel 并行计算

23

物种和功能组成

MetaPhlAn2物种组成,HUMAnN2功能组成

24

物种和功能可视化

LEfSe、STAMP、GraPhlAn、Krona

25

网络分析

igraph、SpaCC网络绘制物种、功能和多网络属性比较

26

网络美化

Cytoscape、Gephi网络美化和修改

31

无参质控软件

FastQC, Trimmomatic, MultiQC, Khmer

32

拼接和分箱

MEGAHIT, QUAST, MaxBin2, MetaBAT, VizBin

33

物种和基因注释

Prokka, Salmon, Kraken

34

功能注释

KEEG、EggNOG、CAZy、CARD

35

细菌基因组进化

Bins提取保守基因、多基因进化树

36

AI排版与绘图

AI多图调整一致和简单模式图绘制

37

考试50题

自评学习效果、知识点回顾

41

答疑-线上

答疑、考试内容串讲

针对使用R语言绘图学习时间成本较高的问题,易生信团队针对常用16种图开发了免费绘图网站,一键出图,更可鼠标点选参数修改图形的个性样式。

宏基因组分析基本思路——有参分析流程。主要通过MetaPhlAn2基于己报导的所有微生物基因组获得物种组成,基于UniRef、EggNOG、KEGG等蛋白数据库确定功能组成。16S扩增子数据本身只包含物种组成,可通过PICRUSt获得KEGG/COG的功能组成。

宏基因组无参分析,主要有两个目的:一是获得未被注释的物种和基因表达;二是通过Binning挖掘新物种的基因组。看样子很美好,但实际操作起来对计算量要求非常大。分析过程中比有参多了组装、基因预测、非冗余基因集构建和基因注释等步骤。

宏基因组基因组成、丰度、覆盖度等信息可视化

本文分享自微信公众号 - 生信宝典(Bio_data),作者:lingludi

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 微生物组—宏基因组分析专题研讨会(2020.2)

    在广大粉丝的期待下,《生信宝典》联合《宏基因组》在2020年2月14-16日,北京鼓楼推出《宏基因组分析》专题培训第七期,为大家提供一条走进生信大门的捷径、为同...

    生信宝典
  • 高通量数据分析必备|基因组浏览器使用介绍 - 1

    基因组浏览器是高通量测序分析的一个重要的可视化工具。相比于最终提供的表格,基因组浏览器可以提供更多的信息,如直观展示突变位点、查看有无新转录本或新的可变剪接形式...

    生信宝典
  • 如何获取目标基因的转录因子(上)——Biomart下载基因和motif位置信息

    科研过程中我们经常会使用Ensembl(http://asia.ensembl.org/index.html) 网站来获取物种的参考基因组,其中BioMart工...

    生信宝典
  • 利用 Python 分析 MovieLens 1M 数据集

    MovieLens数据集是一个关于电影评分的数据集,里面包含了从IMDB, The Movie DataBase上面得到的用户对电影的评分信息,详细请看下面的介...

    JavaEdge
  • [Keras实用技巧]·错误Sequential has no attribution “validation_data”解决

    错误描述:Sequential has no attribution “validation_data”

    小宋是呢
  • Weblogic漏洞修复

    可参考官方说明:https://www.oracle.com/security-alerts/cpuapr2020.html

    何刚
  • GitHub学习篇之如何创建代码库以及删除代码库(简单易用)

    LZ-Says:不得不说GitHub很是强大,貌似这年月,好多人都玩的6的不要不要的,LZ还处于一问三不知的阶段,实乃不该,今天好好学习学习~

    HLQ_Struggle
  • iOS9系列专题二——全新的搜索功能api 原

            iOS9中为我们提供了许多新的api,搜索功能的加强无疑是其中比较显眼的一个。首先,我们先设想一下:如果在你的app中定义一种标识符,在siri...

    珲少
  • 《猜画小歌》|触手可及的AI,没那么神奇也不那么智障

    昨天,“画画”一词“一夜暴富”了。先是“当年不顾家人反对学画画,现如今前途一片渺茫,求大神支招……”的话题上了微博热门;之后,谷歌又默默地推出了《猜画小歌》小程...

    VRPinea
  • 【精度平均最高80%】机器学习+全基因组测序,准确预测人体特征

    【新智元导读】人类长寿公司的研究人员最近在PNAS发表了一篇论文,利用全基因组测序数据,使用机器学习方法,预测个体的性状。结果表明,研究人员能够比较准确地预测出...

    新智元

扫码关注云+社区

领取腾讯云代金券