Cytoscape插件5:DisGeNET(1)

基本功能

为了产生不同类型的网络,DisGeNET的控制面板提供了可以调整的参数。包含三个标签:gene disease network, disease projects, gene projections.默认的是gene disease network,这种模式下,不同的GDA(gene disease assosiations)网络可以通过选择不同的data来产生。Assosiation类型和/或disease classes由下拉菜单产生。GDA网络可以通过cut-off过滤。另外,GDA网络可以围绕一个特殊的疾病或基因建立,需要通过search boxes。其中一些功能也可以用来产生疾病project和gene project网络。

1.产生疾病相关网络

如果想获得特定某一来源的GDA网络,例如curated data,这是来自于很多网络的经过专家逐一认可的(uniprot,ctd-human,clinvar,orphanet,GWAS Catalog),选择感兴趣的来源即可,然后点create network。 GDA网络包含16969nodes,55641edges。可以应用cytoscape的layout算法来产生你想要的方式,例如选择organic。应用disgenet style。一旦获取了网络,一旦获取了网络,关于nodes和关系的特别信息就可以获得,面板右下角。例如使用cytoscape搜索框发现disgenet不同的疾病,包含alzheimer,如下图

image.png

2.产生gene或疾病projection 网络

如果想获得疾病网络来自于GWAS Catalog的,那么选择desease projection标签。然后选择source为GWASCAT(有下拉菜单)然后摁下create network。这个网络包含231个疾病,2844个edge。见下图

image.png

3.把网络先知道某一个特定的相关类型

建立GDA curated网络,限制类型为causal nutation,那么选择source为curated,从association 类型下拉菜单选择causal mutation。摁下create network,那么GDA网络会获取包含7625个nodes和8289个edges。见下图

image.png

这里,作者提出了一个小问题思考

nodes and 8299 edges. Could you find the gene in network carrying causal mutations for the largest number of diseases? Hint:order genes by column nrAssociatedDiseases?

找出哪个突变在最多类疾病中出现?

image.png

同理,我也做了一个各种疾病标记物的网络,也看了下哪种标记物出现在最多的疾病中,和哪种疾病的标记物最多

image.png

可见,TNF出现在最多的疾病标记物,特异性应该很低了

4.限制网络到某一具体的疾病class

网络也可以通过疾病类型进行过滤。疾病类型基于desease分支(C),和三个categories(F01,F02,F03),这都是基于Psychiatry和Psychology Branch(F),MeSH的等级分类。为了产生来自predicted数据的网络,并且假如我们只想包含Nutritional and metabolic disease。那么选择source(predicted),选择disease class(Nutirtional and metabolic disease)这在disease class下拉菜单实现。然后,create network。这个GDA网络有1237个nodes和1676个edges。考虑下,哪个疾病有最大数目的基因?

image.png

5 建立某一个基因/疾病或疾病/基因的set

控制面板中的search功能可以用于

围绕一个疾病或基因产生网络

围绕一个疾病和基因产生网络

围绕一组疾病或基因产生网络,匹配关键词

搜索可以限制source,关系类型,疾病类型,得分

还是可以不限制条件生成所有网络,然后在控制面板的搜索框输入比如“Alzheimer

或者最好是直接上面条件不限制,在搜索框输入“Alzheimer”这样更快

网络可以通过增加条件进一步过滤,比如输入APP,在gene search box,摁下create network。那么alzheimer所有亚型相关的网络和APP有关的就产生了。每个边代表gene-疾病直接关系的证据,这个关系是被source定义的。一个联系类型,或一片文章。每一个边的颜色区分联系类型。使用edge table在右下角的table panel可以探索每个联系的证据。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【陆勤践行】数据科学的完整学习路径—Python版

从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者已经是数据科学家的...

1989
来自专栏华章科技

数据分析图的十大错误,你占了几个?

优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。全在于以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本。当然并非所有...

871
来自专栏编程

Python数据挖掘学习路线是什么?学习Python学什么?

学习Python数据挖掘,你有明确的路线吗,学任何东西首先你要知道学习它的路线,了解了路线才能更容易学习,学习起来才不会非常费劲,进入正题,看看千锋教育的Pyt...

35610
来自专栏大数据文摘

手把手|用Python端对端数据分析识别机器人“僵尸粉”

2286
来自专栏MyBlog

建立一个线上购物的面向任务的对话系统

该文给出了针对用于线上购物的面向任务的对话系统的一个一般的解决方案, 目标是协助用户完成多样化的购买相关任务, 比如搜索商品和回答问题, 如同正常人之间的对话....

1192
来自专栏PPV课数据科学社区

【学习】数据科学的完整学习路径—Python版

译者:Allen 从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者...

2624
来自专栏机器之心

资源 | 2017年最流行的15个数据科学Python库

选自Medium 作者:Igor Bobriakov 机器之心编译 参与:朱朝阳、吴攀 Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不...

2904
来自专栏钱塘大数据

数据挖掘:用可视化效果展现你的数据

对于数据挖掘,我们可以通过文中对数据可视化的案例找到分析数据、展现数据的方法和思路。 Data visualization 是一件很有趣的事情。最近在尝试处理数...

3335
来自专栏CDA数据分析师

数据科学的完整学习路径—Python版

从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者已经是数据科学家的...

2765
来自专栏数据科学与人工智能

【Python环境】数据科学的完整学习路径(Python版)

从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者已经是数据科学家的...

3015

扫码关注云+社区

领取腾讯云代金券