前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人类微生物组计划 - 宏基因组/16S分析流程 bioBakery

人类微生物组计划 - 宏基因组/16S分析流程 bioBakery

作者头像
生信宝典
发布2018-10-25 10:34:37
4K0
发布2018-10-25 10:34:37
举报
文章被收录于专栏:生信宝典生信宝典

bioBakery是NIH人类微生物组计划实施过程中开发的部分软件和使用教程的集合,主要由哈佛大学的Huttenhower实验室开发。提供了16S, 宏基因组宏转录组分析的全部流程,并可以生成结果报告。

其主要工具如下(可单独安装,也可打包安装):

这都是宏基因组和16S分析常用工具,软件使用请看宏基因组分析教程合集

biobakery安装

下面4中安装方式,按需选择。

  1. 使用conda一个个安装,Conda安装方法
  2. 使用Docker安装,docker run -it biobakery/workflows bashDocker使用教程
  3. 使用HomebrewLinuxbrew安装,brew install biobakery/biobakery/workflows
  4. 使用pip安装(部分依赖包需要手动安装),pip install biobakery_workflows

biobakery数据库安装

代码语言:javascript
复制
# To install the full shotgun databases:
biobakery_workflows_databases --install wmgx

# To install the full 16s databases:
biobakery_workflows_databases --install 16s

16S分析流程

代码语言:javascript
复制
# All input files are located in the folder input and all output files will be written to the folder output_data.

biobakery_workflows 16s --input input --output output_data

这个分析流程与我们的培训扩增子有参无参和功能分析主体类似,而且我们在这个基础上做了比较多的拓展,可以获得更多定制分析结果。本课程也有配套视频在腾讯课堂https://bioinfo.ke.qq.com/, 欢迎观看。

16S DADA2分析流程

宏基因组流程

软件流程网址

https://bitbucket.org/biobakery/biobakery/wiki/biobakery_workflows (后台回复 biobakery获取可点击的链接)

新一期的宏基因组课程开始了,2018年10月19-21日, 相约北京鼓楼,一起讨论宏基因组分析专题。内容涵盖这套流程,并且增加了无参宏基因组分析(bin)。

课程大纲

每节课1小时一个主题,理论结合实战,学懂原理,实战实操,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课,41为两周后的线上集中视频答疑。

编号

主题

简介

11

Linux基础

简介、远程登陆、文件传输、常用命令

12

Linux软件安装

Conda安装与配置,宏基因组相关软件安装

13

Win软件安装

git、R、Rstudio、R包、STAMP、AI等

14

图表解读

常用分析图表在文章中意义和使用场景

15

R基础

发展史、生物学中应用、ggplot2绘图

16

可视化

16种图表的数据整理和在线绘制

21

宏基因组简介

发展史、常用技术适用范围、分析思路

22

宏基因组有参质控

KneadData质控、parallel 并行计算

23

物种和功能组成

MetaPhlAn2物种组成,HUMAnN2功能组成

24

物种和功能可视化

LEfSe、STAMP、GraPhlAn、Krona

25

网络分析

igraph、SpaCC网络绘制物种、功能和多网络属性比较

26

网络美化

Cytoscape、Gephi网络美化和修改

31

无参质控软件

FastQC, Trimmomatic, MultiQC, Khmer

32

拼接和分箱

MEGAHIT, QUAST, MaxBin2, MetaBAT, VizBin

33

物种和基因注释

Prokka, Salmon, Kraken

34

功能注释

KEEG、EggNOG、CAZy、CARD

35

细菌基因组进化

Bins提取保守基因、多基因进化树

36

AI排版与绘图

AI多图调整一致和简单模式图绘制

37

考试50题

自评学习效果、知识点回顾

41

答疑-线上

答疑、考试内容串讲

针对使用R语言绘图学习时间成本较高的问题,易生信团队针对常用16种图开发了免费绘图网站,一键出图,更可鼠标点选参数修改图形的个性样式。

宏基因组分析基本思路——有参分析流程。主要通过MetaPhlAn2基于己报导的所有微生物基因组获得物种组成,基于UniRef、EggNOG、KEGG等蛋白数据库确定功能组成。16S扩增子数据本身只包含物种组成,可通过PICRUSt获得KEGG/COG的功能组成。

宏基因组无参分析,主要有两个目的:一是获得未被注释的物种和基因表达;二是通过Binning挖掘新物种的基因组。看样子很美好,但实际操作起来对计算量要求非常大。分析过程中比有参多了组装、基因预测、非冗余基因集构建和基因注释等步骤。

宏基因组基因组成、丰度、覆盖度等信息可视化

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-10-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信宝典 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • biobakery安装
  • biobakery数据库安装
  • 16S分析流程
  • 16S DADA2分析流程
  • 宏基因组流程
  • 课程大纲
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档