重磅!重磅!重磅!欧易宏基因组分析重要升级必须了解一下!

????点击上方蓝字把我们设为星标吧✴

前 言

十一长假结束已近2周,虽说每天叫醒我们的不是闹钟而是梦想,怀揣着对工作的热情,我们的小仙女和小帅哥们是没有“假期后适应期”的,但,该打的鸡血还是要打一打的。

重磅鸡血就是:欧易生物宏基因组升级已全面完成!!!

宏基因组测序数据,因复杂的环境物种构成,在数据的利用,拼接等方面,相对来说有一定难度,需要我们更深入去挖掘这冰山之下的信息。

升级之后的宏基因组的分析,加量不加价,居家旅行必备之良药。流程及内容如下:

本次升级主要体现在以下几方面:

分析内容更为丰富(重点: 同时在物种、基因、功能3个不同层面展示并比较)

报告的可读性增强

展示结果美观性升级

丰度算法、统计算法优化

一、丰富常规分析内容

宏基因组数据可以在物种、基因、功能3个角度和层面来进行挖掘。

1、基于基因数目和丰度我们增加了如下分析:

1.1 core-pan 基因分析-从基因在各样品中的丰度表出发,构建和绘制Core 和 Pan 基因的稀释曲线:

图 | Core 基因稀释曲线示例

图片说明:横坐标表示抽取的样品个数;纵坐标表示抽取的样品组合 Core 基因数目

图 | Pan 基因稀释曲线示例

图片说明:横坐标表示抽取的样品个数;纵坐标表示抽取的样品组合 Pan 基因数目

1.2 组间基因数目分析-可以直观的反映组与组间的基因数目:

图 | 组间基因数目小提琴图

图片说明:横坐标为各个分组信息;纵坐标为基因数目

1.3 基于基因丰度的样品间相关性及聚类分析-用于揭示样本间的相似性及相关性:

图 | 样品间相关系数热图

图 | 样品间相似性聚类图

2、在物种丰度和构成层面上,我们增加了一系列的分析:

2.1 Krona分析-可以综合而直观的展示各样品中不同分类层级的物种相对丰度:

2.2物种丰度的 Anosim 分析-用来检验组间的差异是否显著大于组内差异, 从而判断组间的物种构成的差异情况

图片说明:横向为分组信息, 纵向为距离信息。 Between 为两组合并信息, between 中位线高于另外两组中位线为分组信息较好。 R-value 大于 0, 说明组间差异显著。 R-value 小于 0, 说明组内差异大于组间差异, 统计分析的可信度用 P-value 表示, P< 0.05 表示统计具有显著性

2.3 组间差异物种Metastat 分析-从不同层级的物种丰度表出发研究组间具有显著性差异的物种:

图 | 横轴为样品分组;纵向为对应物种的相对丰度

p< 0.05 表示两组间差异显著, p< 0.01 表示两组间差异极显著

2.4 LEfSe 分析-揭示两组或以上生物群落差异物种的组成:

3、在功能层面,除了较常用的KEGG、GO数据库之外,我们还增加了一些重要数据库的注释

3.1 eggNOG 数据库-利用 Smith-Waterman 比对算法对构建的基因直系同源簇 (Orthologous Groups) 进行功能注释。

图 | eggNOG数据库注释结果展示

3.2 CAZy 数据库-是研究碳水化合物酶的专业级数据库, 主要涵盖 6 大功能类:糖苷水解酶(Glycoside Hydrolases , GHs), 糖基转移酶(Glycosyl Transferases, GTs), 多糖裂合酶(Polysaccharide Lyases, PLs), 碳水化合物酯酶(Carbohydrate Esterases, CEs), 辅助氧化还原酶(Auxiliary Activities , AAs)和碳水化合物结合模块(Carbohydrate-Binding Modules, CBMs):

图 | CAZy数据库注释结果展示

3.3 CARD 抗性基因数据库-CARD 整合了 ARDB 的全部数据,以 ARO(Antibiotic Resistance Ontology) 为核心对抗性数据进行整理。注释以及图形展示结果如下:

图 | CARD 数据库注释结果展示

图 |各样品抗性类型分布circos图

3.4 VFDB 数据库-全称为 Virulence Factors of Pathogenic Bacteria , 是用于研究致病细菌、衣原体和支原体致病因子的数据库:

图 | VFDB 数据库注释结果表头说明

3.5 病原与宿主互作数据库(PHI)-PHI 全称为 Pathogen Host Interactions Database, 病原与宿主互作数据库, 该数据库经过了实验验证,是目前医疗、农业真菌和卵菌候选靶向位点的重要资源:

图 | PHI数据库注释结果表头说明(部分)

同时我们提供了基于这些特定功能丰度的统计图(Barplot)、聚类热图、PCA、PCoA、NMDS、Anosim分析,以及组间功能差异的Metastat分析、LEfSe 分析等。

当然还有其他的数据库,比如:杀菌剂即金属抗性基因组数据库、抗菌多肽数据库等。如有需求,欢迎老师随时咨询

二、报告可读性以及展示图片结果的美观化

1、报告结构调整,并增加整个项目摘要,可以第一时间快速了解项目的分析概况:

2、完善了所有的表格、图片的说明,报告文字描述及表头解释兼顾了专业和清晰易懂。

3、可视化更美观,增加美观且高分文章中出现频次较高的图形到常规报告,具体细节在第三部分已有展示。

三、高级分析挖掘优化

当然还有之前提到过的高级分析内容:

(肠型分析)

(contig binning分析)

四、丰度算法、统计算法优化

针对基因丰度、物种丰度、功能丰度不同层面,我们优化了算法,提供了更合适更准确的计算方法,以及更为合适的差异统计方法。

掐指一算,2018年还有不到3个月的时间,心动不如行动,各位老师如果想加快科研的步伐,不要犹豫尽快来体验吧!!

小彩蛋:欧易生物微生物多样性分析项目扩展了部分专题分析,除了常规分析,还免费给符合分析条件的项目给予专题分析,充分挖掘客户需求。如:肠道微生态、环境微生态、健康微生态等,怎么样~心动了么?

欧易帅哥美女等着你……

- 扩展阅读 -

- END -

齐天大圣  撰文

本文系欧易生物原创

欢迎转发到朋友圈

转载请注明本文转自欧易生物

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181018B1FLPH00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券