【直播】我的基因组76:用krona对血液全基因组的菌比例可视化

关于我前面我说到的NGS测序血液里面的菌的问题,总共8.9亿reads里面是有部分(850万)无法比对上的,850万里面只有不到10万比对到了微生物,说明我的基因组里面的微生物序列实在是太少了。很多人都给我了一些解释:

其实我用的软件和数据库就是基于kmer的,所以Tong Liu的解释我很认同。

liang博士

血液中有大量的细菌即菌血症,是很严重的感染。但是血液中有少量的细菌很正常,本来免疫系统的吞噬清除和微量感染就是一个平衡,准无菌水平而已。reads只占这么少的部分正常。

我们生信技能树论坛早就有帖子介绍:http://www.biotrainee.com/thread-1403-1-1.html 人类血液里面必然是有细菌等微生物(点击原文进行查看)

苏博士

上面的朋友说得差不多了。

湿的方面:多数是污染,气溶胶之类的污染还是不能完全避免。还有就是毕竟不是每个人都是“标准基因组”。

干的方面:也有极少量是随机匹配上的。还有就是比对软件也有各自的局限的,其实哪有绝对的标准答案。

另外,上面的一位朋友可以拿同样的数据再比对看看结果,比对数量增多可能只是细菌的数据库越来越丰富了而已。

虽然我也相信正常人血液中会存在痕量细菌这一情况,但其实就算这些测到的真是细菌的reads,那离血液中存在细菌这个结论还差得远呢。所以这个标题有点标题党了。甚至,也有可能这个结果比真实情况还偏低呢,针对动物血液的试剂盒,对细菌DNA的提取效率未必高。

随着高通量方法的发展,科赫原则也有了不少新的修正和发展,但其实也没个公论。

其他吃瓜群众说到:

吃瓜群众

抽血也可以引入皮肤定植菌,可以查一查这些细菌通常的传播途径和看看是不是很多可以经呼吸道传播。还有就是是不是正常菌群里的,比对一下病毒库,说不定也有很多病毒序列呢

下面进入正题:

前面我们介绍了表格版本的总结结果,比对成功的reads具体按照界门纲目科属种给数一下多少,然后算一下百分比。

其实比较主流的是用krona这个可视化js插件来把这个层级表格展现出来,如下:

圈圈从内到外依次是,界门纲目科属种,一般来说看最外层的各个菌种的占比即可。

要做这个图,首先需要安装krona软件,然后根据GOTTCHA软件对reads的分类文件进行处理即可。

Krona 百度搜索结果一般是冰岛克朗,是冰岛的官方货币,不过在生物信息学领域是一个可视化工具,而且用的是html5哦。你谷歌就明白了!

主页:https://github.com/marbl/Krona/wiki

安装方法是:

cd ~/biosoft
# https://github.com/marbl/Krona/wiki
mkdir Krona && cd Krona
wget https://github.com/marbl/Krona/releases/download/v2.7/KronaTools-2.7.tar
## https://github.com/marbl/Krona/wiki/KronaTools
tar xvf KronaTools-2.7.tar
cd KronaTools-2.7
mkdir bin
./install.pl --prefix ./

可视化命令:

~/biosoft/Krona/KronaTools-2.7/bin/ktImportText  P_jmzeng_temp/P_jmzeng.lineage.tsv -o P_jmzeng.krona.html

打开生成的html文件,就能看到上面的图啦。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-05-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏极客猴

应该如何阅读?

我最近阅读民主与建设出版社出版的《如何阅读一本书》,自己收获颇多。这本书算是经典之作。以通俗的语言告诉我们如何选择书籍?究竟要以什么方法来阅读一本书?我将自己学...

842
来自专栏PPV课数据科学社区

趣文 | 程序员们,都进来看看编程语言之父都有谁

1、PHP PHP之父,Rasmus Lerdorf,1994年,为了要维护个人网页而制作的一个简单的用Perl语言编写的程序。这些工具程序用来显示 Rasmu...

3257
来自专栏FreeBuf

八百元八核的服务器?二手服务器(工作站)搭建指南(下)| 你们要的第二弹

本文分成两部分,上一部分传送门:《八百元八核的服务器?二手服务器搭建指南》 在上一部分我们已经学习了搭建二手服务器的基础知识,这部分,我们将深入学习各种配件的详...

4529
来自专栏申龙斌的程序人生

使用GTD(Getting Things Done)打造整洁高效的办公环境

估计办公室混乱是我们男人的专利,整个办公室里没有落脚的空隙时才能体现出大忙人的状态,彰显男人的价值。下面这张图是我前几天从同事的办公室随手照的,已经把关键信息进...

2905
来自专栏程序员宝库

数据 | 基于 Python 分析微信好友数据

最近微信迎来了一次重要的更新,允许用户对"发现"页面进行定制。不知道从什么时候开始,微信朋友圈变得越来越复杂,当越来越多的人选择"仅展示最近三天的朋友圈",大概...

1114
来自专栏竹清助手

果拾网推荐高清图片资源

653
来自专栏镁客网

有了这只翻译笔,你也能轻松掌握130国语言

1335
来自专栏飞总聊IT

大数据时代的装逼利器之CAP理论

诸位读者在读这篇文章之前请先举个手,有没有谁听说过CAP理论,又有谁明白CAP理论到底是个什么东西的?作为新时代的码农和数据工程师,在大数据的浪潮下要是连CAP...

2583
来自专栏域名资讯

域名“花香”potpourri.com以超14万元结拍

尽管对于中国网民来说,英文的域名相对来说比较难记忆和理解,但是投资域名的话,好的域名还是非常吃香的,不管在于海内外。近日,在海外的一些平台就结拍了几...

1808
来自专栏知晓程序

坐得久,玩着香!这 4 个微信「厕所小游戏」,给你非一般的体验

722

扫码关注云+社区