专栏首页科技记者分析粪便微生物移植后患者高通量单分子实时测序数据的工作流程

分析粪便微生物移植后患者高通量单分子实时测序数据的工作流程

有许多基于测序的方法来了解复杂宏基因组,从全样本鸟枪法测序到靶向扩增。虽然靶向方法在低测序深度提供有价值的数据,但它们受引物设计和PCR限制。全样本鸟枪法通常使用短读长测序,这导致数据处理困难。例如,长度小于500bp的读数很少覆盖完整的感兴趣的基因或区域,所以将需要组装。这不仅引入了来自不同社区成员的序列不正确地拼接的可能性,还需要高覆盖深度。因此,罕见的社区成员可能不会在结果集合中被表示。、

循环共识,单分子实时(SMRT)测序读长在1-3 kb范围内,精度可达99%以上,可以使用上一代PacBio RS II产生,或者在更高的通量下,使用新的Sequel系统。尽管与短读取测序方法相比,吞吐量较低,但读长是社区的真实随机抽样,因为SMRT测序已被证明具有非常低的序列偏好。单分子读数> 1kb,> 99%的共有准确度,可以合理地利用高比例的reads包括可用于分析的基因或基因片段,而无需重新组装。

在这里,我们介绍了在进行粪便微生物群移植(FMT)之前和之后,为了治疗慢性艰难梭菌感染的个体微生物群的循环共识测序的结果。我们显示即使具有相对较低的测序深度,长读长,无装配,随机抽样也可以让我们在物种层面描述低丰度的社区成员。我们还显示,使用长读长的鸟枪测序,由于整个基因被单一reads覆盖,所以可以实现使用经典的目标16S或短读长测序技术无法实现功能性的预测。

长读宏基因组分析工作流程

A)平均长度约2 kb的剪切基因组DNA在PacBio系统上制备并测序。多重测序通过SMRTbell模板进行,允许生成高质量的循环共识序列(CCS)读数。

B)Prodigal(原核动态规划Genefinding算法)1,用于预测共有序列中的基因,并计算氨基酸序列。 blastp用于将推定的蛋白质序列与RefSeq细菌蛋白质数据库进行比对。

C)blastn用于将准确的CCS读数与RefSeq基因组数据库比对0。

D)来自任一方法的Blast结果被导入到MEGAN2中,并且使用最低通用祖先(LCA)算法为每个序列分配分类

来自在PacBio RS II或Sequel系统上测序的多个FMT微生物组分样品的吞吐量。

前后FMT样品在上一代PacBio RS II系统下进行测序,是本海报进一步讨论的样品。样品FMT 3,5和6是相似的,但不同的FMT样品运行在较高的吞吐量Sequel系统上进行比较。请注意,统计数据不仅受到排序系统的影响,也受文库质量的影响。 测序文库的较大尺寸分布将产生更多的预测基因。 新的Sequel系统和大小分布约2 kb的文库可以产生> 40万个基因,其中> 25万个全长,如Prodigal。

FMT - 分类概况

来自慢性艰难梭菌感染个体的FMT前后样本的分类学特征。

与Microarray和16S分析数据进行类级别比较。 CCS方法在单个个体上证明,公布的微阵列和16S数据涵盖不同时间点的多个个体。

(B)FMT前后的高分辨率比较。 长读长高精度的读数允许在物种上进行分析,在某些情况下在菌株水平。

(C)实施blast针对核苷酸和氨基酸检索。 在这种情况下,核苷酸分类具有更多的功能,因为蛋白质序列在不同物种之间是保守的。

FMT - KEGG功能分析

图3. 长读长高精度读取的基因预测可以鉴定功能蛋白

每个小组显示KEGG途径和FMT前后样品中发现的同源蛋白的频率。

(A)TCA途径中酶的频率在两个样品之间是一致的。

(B)与鞭毛组装相关的蛋白质特异于Pre-FMT样品。

(C)Pre-FMT样品中富集了细菌分泌系统,II型和VI型分泌途径,而在两个样品中都发现了一般的Sec-SRP。

结论

使用单分子CCS读数的长读宏基因组分析提供了独特的数据类型,与16S和霰弹枪装配方法相比具有明显的优势。虽然对输入量低和片段化DNA等样品输入问题具有高度的耐受性,但长读宏基因组分析允许物种级别,在某些情况下允许菌株级分类学分类和功能研究。Sequel系统的这种实验的通量使得单次测序运行可以产生来自宏基因组学社区的145,000个全长基因。对于FMT前和后FMT微生物组样本,我们显示与16S和微阵列数据相当的结果,同时允许更详细,物种级分类和功能洞察。

本文分享自微信公众号 - 科技记者(kejijizhe),作者:zd200572

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-09-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 探索一个消费级基因检测结果

    最近生信技能树公众号抽奖,中了一个基因检测试剂盒,挺开心的,给我老婆检测了一下,恭喜她成为我们家第一个有基因检测数据的人。感谢陕西图灵生物的奖品。检测是采用消费...

    用户1075469
  • ubiome数据分析流程学习笔记1

    虽然ubiome倒下了,但是它的知识产权还是有价值的,要不也不会有公司出价收购,那么,我们看下它的方法具体细节是怎样的呢?

    用户1075469
  • 简单的snptest要不要学

    下载地址在这个网站 https://mathgen.stats.ox.ac.uk/genetics_software/snptest/snptest.html

    用户1075469
  • illumina、Sanger、第三代和第四代测序技术原理

    1953年4月,Watson和Crick关于DNA双螺旋结构的文章发表于Nature,成为生物学研究的里程碑。此后,生命科学进入了DNA解密的时代。道德经所言“...

    DoubleHelix
  • 哪些行业需要使用高防服务器?

    如今,随着互联网的普及,企业的业务开展离不开服务器,特别是针对热门互联网行业,如游戏、金融、电商、直播等领域,推荐使用高防服务器。因为这几个行业竞争非常激烈,容...

    墨者安全科技
  • Libra新编程语言 :Move 的所有权模型灵感来源原来是它……

    智能合约是一类专用于管理有价值数字资产所有权的独特软件。尽管现有的编程环境可以用来跟踪资产的所有权,但是它们通常被用来反映所有权,而非直接定义所有权。智能合约的...

    区块链大本营
  • 学界 | 离「脑机接口」再近一步,日本研究员根据大脑fMRI重建看到的图像

    AI 科技评论按:位于日本的国际电气通信基础技术研究所(ATR)的计算神经科学实验室和京都大学日前联合发布了一篇论文,他们可以借助 fMRI(功能性磁共振成像)...

    AI科技评论
  • BeanWrapper解析

    爱撒谎的男孩
  • 【AI白身境】一文览尽计算机视觉研究方向

    图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务,从最开始比较简单的10分类的灰度图像手写数字识别mnist,到后来更大一点的10分...

    用户1508658
  • 【AI白身境】一文览尽计算机视觉研究方向

    相信看了前面的几篇文章后很多朋友已经等不及快速入行了,今天就来介绍一下计算机视觉的各大研究方向及其特点。

    机器视觉CV

扫码关注云+社区

领取腾讯云代金券