专栏首页生信宝典挖掘PubMed数据库,获取报道的或推测新的基因调控关系

挖掘PubMed数据库,获取报道的或推测新的基因调控关系

生信宝典之傻瓜式推出过基于Cytoscape的插件literature search进行文献挖掘查找指定基因调控网络的方

近来发现一款神奇的在线工具 (Chilibot, chip literature robot, http://chilibot.net/)可以完成同样的分析,而且看上去功能还更强大。

结果展示

采用两个关键词cocaineplasticity (蓝色节点)配对搜索获得cocain治疗对可塑性的影响相关的一系列基因。基因的颜色代表表达值(绿色是上调,红色是下调)。连线上的数字代表这一关系的权重 (后面有计算方式)。点击每个点,可以查看对应的文献信息或针对该节点进行进一步分析。

配对搜索

如下做配对搜索,查看给定的基因、通路、疾病之间存在的互作。

提交后,展示搜索进程和语义分析

获得互作结果, 左侧是网络图,右侧是图例。图中的数字代表支持两个节点关系的权重。

每个节点可进一步点击查看, 获取包含此节点的文献和文献中的语句。每个也可以进一步点击查看,获取包含这个调控关系的文献和对应的语句,不失为一个快读读文献的工具。

双列表搜索

1个列表中的关键字会互相配对搜索它们之间的关系,然后每个再与第2个列表中的关键字配对搜索对应的关系。

List 1

BDNF
TRKB
TRKC
CHRNA7
PSD95
CREB
HPRT
ARC
NUR77

List 2

APOPTOSIS (programed cell death; PCD)
Hippocampus
STEM CELLS

结果如下,一个比较复杂的网络。

点击某个节点可绘制以该节点为中心的网络,还可以根据网络中的连通性推测出之前未被报道的调控关系,比如ApoptosisARC没有文献报道,但他们都与网络中的6个基因有调控关系,那么他们之间可能也会有调控关系,就形成了一个新的假说。

如果网络中的节点不能点击,点一下sort nodes by number of relationships刷新下网络就可以了。

展示表达值

输入如下,基因名字后面跟上基因的表达倍数变化 (空格分开)

节点的颜色根据表达量标记了红色(下调)和绿色(上调),与常规不太一致。

具体的上色方式见下 (数值为fold change 不能取对数):

权重计算

Words suggesting a conclusion, such as “suggest”, “found”, “show”, “data” etc weights as +9 points. Starting the sentence with the query term and a verb weights as +5 points. The presence of words suggesting a negative result such as “not”, “lack”, “fail”, “without” is weighted as -3 points. Having more than 30 words also reduces the weight by 3 points. Lastly, having keywords specified by the user adds 5 points to the weight. The 15 sentences with the highest weights are displayed.

程序查询

文中也提供了一个程序化获取方式,以Perl语言为例,其他程序语言也可以,本质是网页提交和抓取。

#!/usr/local/bin/perl
use LWP::Simple qw(get);

# Provide your email address so that you receive a notification when a query is done (if more than 6 terms are queried).

my $email="me\@my.domain";

#my $sessionName="testing"; # session name is optional

my $terms="apoptosis\ncreb\nbdnf\n";

&searchChilibot ($email, $sessionName, $terms);

sub searchChilibot{
    my $email=shift;
    my $sessionName=shift;
    my $terms=shift;
    my $url="http://www.chilibot.net/cgi-bin/chilibot/chilibot.cgi?email=$email&IN=t&list=$terms&name=$sessionName";
    print "Waiting for Chilibot response (may take a while) ..\n";
    my $response=get ($url);
    if ( $response=~m|Done!.+?<a href=(.+index\.html)|){
        print "search is done: http://www.chilibot.net$1\n";
    }
    if ($response=~m|<div *class=\"warning\">(.*)</div>|){
        print "error:$1\n";
    }
}

本文分享自微信公众号 - 生信宝典(Bio_data),作者:生信宝典

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-04-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 纳尼?Genbank中超200万条序列受污染!蛋白污染主要来源于一只蜘蛛?

    Metagenomic sequencing allows researchers to investigate organisms sampled from ...

    生信宝典
  • 分子对接简明教程 (三)

    Docking非原生配体 在前面的例子中,AutoDock Vina能把配体构象调整到几乎原生的构象,验证了这一预测方法的准确度。下面,我们尝试docking另...

    生信宝典
  • 不是原配也可以-对接非原生配体

    Docking非原生配体 在前面的例子中,AutoDock Vina能把配体构象调整到几乎原生的构象,验证了这一预测方法的准确度。下面,我们尝试docking另...

    生信宝典
  • C++核心准则C.50:如果在构造过程中需要“虚行为”,使用工厂函数

    C.50: Use a factory function if you need "virtual behavior" during initializatio...

    面向对象思考
  • SwiftUI:创建显式动画

    您已经了解了SwiftUI如何通过将animation()修饰符附加到视图来创建隐式动画,以及它如何通过将animation()修饰符添加到绑定来创建动画,但是...

    韦弦zhy
  • MHA架构搭建(模仿淘宝)

       MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司youshimaton...

    萧晚歌
  • leetcode508. Most Frequent Subtree Sum

    Given the root of a tree, you are asked to find the most frequent subtree sum. T...

    眯眯眼的猫头鹰
  • POJ2488-A Knight's Journey(DFS+回溯)

    题目链接:http://poj.org/problem?id=2488 A Knight's Journey Time Limit: 1000MS ...

    llhthinker
  • 物化视图相关操作

    bsbforever
  • Linux 性能测试工具 sysbench 的安装与简单使用

    sysbench是一款开源的多线程性能测试工具,可以执行CPU/内存/线程/IO/数据库等方面的性能测试。 sysbench 支持以下几种测试模式 :

    耕耘实录

扫码关注云+社区

领取腾讯云代金券