数据挖掘专题四

接着上一期,我们找到差异基因以后,我们希望找到这些差异基因的功能,看它富集在哪些功能上,我们就可以做一下GO的富集分析。

一般GO(Gene oncology)按照生物途径(Biology Process),分子功能(Molecular Function)和细胞定位(Cellular Location)对基因进行注释和分类。通过对差异表达基因进行GO terms富集度统计学的分析,计算出差异基因GO term的p-value和p-value的FDR值(q-value),定位差异基因最可能相关的GO term。

这里我再给大家推荐一款软件,叫cytoscape,我们会用到其中一个插件叫BINGO,那好,我们就开始我们今天的学习。

首先打开界面后,我们依次点击APPs—APP manager,在弹出的对话框里面我们打入bingo,系统就会自动搜索,再点击安装该插件。

插件下载完成后,我们点击APPs—BINGO,则出现了下面这个界面。

在这里,我们在cluster name中命名为dna,然后点击编号为2的那一行中的Paste Genes From Text,把我们之前的找到的差异基因复制黏贴在空白框内。在collect oncology file中我们选择GO Full,该选项其实就包括一开始我们说的GO的三部分:生物途径(Biology Process),分子功能(Molecular Function)和细胞定位(Cellular Location)。

由于我们的基因是来源于老鼠,那在编号为4那一行选择Mus musculus。在最后一行点击Check box for saving Data,然后再点击Save BiNGO Data File,将输出的文件保存在自己指定的地方。这里我们选择保存在桌面。最后我们点击Start BiNGO。

我们用excel打开桌面上刚刚保存的文件,会发现每一条富集通路是按照p值由小到大依次排列,其中第H列表示该通路所涉及的生理病理过程,而该列的后面指的是我们之前输入的富集在该条通路上的部分基因。

这里我们就根据我们所要研究的方向,从这么多通路里面选择自己感兴趣的进行进一步研究。

除了上面那张表格输出外,cytoscape给我们自动生成了一张有向无环图,其中分支代表包含关系,箭头方向从上之下所定义的功能范围越来越小,并通过包含关系,将相关的GO Term一起展示,颜色深浅代表富集程度,越深富集水平越高,反之,则越低。

然后对于结果输出,我们依次点击左上方的File—Export—Network as Graphics,一般我们选择保存文件的格式是PDF。

好了,到这里我们这一讲就告段落了,希望大家再接再厉,反复练习,一起将数据挖掘到底!下一期再见!

本文来自企鹅号 - Freescience联盟媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Web 开发

宏基4535-651G25Mn

中规中矩的配置,运行WIN7应该没有问题,便便今晚的装WIN 7后,时不时会卡,并且不是一般的卡,放首歌都会卡

9510
来自专栏生信宝典

我想做信号通路分析,但我就是不想学编程

这篇文章就教大家,如何一句代码都不用敲,通过简单的复制粘贴还有点两下鼠标,就能实现通路富集的分析。

19850
来自专栏逍遥剑客的游戏开发

一个困扰我一个多星期的Nebula3的BUG

18530
来自专栏Crossin的编程教室

喜大普奔!Django官方文档终于出中文版了

之前对于 Django 的学习我一直推荐看官方文档,但不得不加上一句“如果你英语水平允许的话……”。现在总算是等来好日子了。各位想向网站/服务器开发方向进阶的同...

22510
来自专栏玉树芝兰

如何用Python批量提取PDF文本内容?

本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析。

50520
来自专栏Laoqi's Linux运维专列

Ansible线上部署出现中文乱码

29620
来自专栏程序手艺人

移植WebRTC中的VAD

1.2K50
来自专栏SDNLAB

SDNLAB技术分享(八):Neutron的基本原理与代码实现

一、Openstack网络基础 下面对Openstack和Neutron的介绍,要从几个关键词入手。 1. 三代网络 在网络这一口,OpenStack经历了由n...

38570
来自专栏FreeBuf

APP漏洞自动化扫描专业评测报告(中篇)

*本文原创作者:Sunnieli,本文属FreeBuf原创奖励计划,未经许可禁止转载 前言 上一篇中通过对阿里聚安全[1]、360App漏洞扫描[2]、腾讯金刚...

42050
来自专栏跟着阿笨一起玩NET

C#中的串口通信

串行接口按电气标准及协议来分,包括RS-232-C、RS-422、RS485、USB等。 RS-232-C、RS-422与RS-485标准只对接口的电气特性做出...

54320

扫码关注云+社区

领取腾讯云代金券