首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

不会编程,你也可以做差异表达分析

前几天一个同学问我有没有用过GEO2R,说实话之前没有用过,但我有认真的看了GEO2R后发现对于不会编程的同学来说,这真是一个非常好用的网页版做差异表达基因的工具.

我们可能已经知道做基因的差异表达分析有两个著名的R包,分别是DESeq2和EdgeR,这两个R包主要用来做RNA-seq的数据分析,但是这两个是R语言的包,需要有一定的编程基础。你说:我不会编程,但我想做差异表达分析,有现成的网页版的工具吗?那就是我们今天要介绍的GEO2R.

GEO2R,从名字上就可以看出来是用来分析GEO数据的工具,它可以确定不同实验条件下差异表达的基因。链接是:https://www.ncbi.nlm.nih.gov/geo/geo2r/

GEO2R内部是如何对数据进行分析的呢?它虽然没有用到任何编程的命令行,但是它的内部还是调用了两个R包,分别是GEOquery和limma。GEOquery直接在R中调用GEO数据;limma也是一个比较常用来做差异表达分析的R包。

接下来我们看看GEO2R的使用方法吧。

在GEO中找到我们感兴趣的数据集,如GSE100942,如下图所示:

接着点击”Analyze with GEO2R”,即可出现如下图所示的GEO2R界面,接着设置"define groups",把样本分为不同的组。如下图所示:

在做差异表达分析之前,我们需要先了解我们的数据是否已经做过标准化,因为GEO2R是没有办法对数据做标准化的,其中是否有做过标准化的一个标准就是看数据是否有非常大的方差,如果方差较大,也说明数据可能是没有做过标准化的。如何查看数据呢,可以通过“Value distribution”按钮对数据进行查看。

查看完标准化的数据后需要对数据做差异表达分析,这时候需要对分析过程做一些参数设置,需要点击“Options”按钮。其中“Apply adjustment to the P-value”是可以选择对P值做矫正的方法;“Applylog transformation to the data”是选择是否对数据取log值转换。

接下来直接点击“GEO2R”就可以生成结果了,其中“Top250”表示只选择前250个结果。当然这个结果可以直接在网页中显示,也可以保存在本地,用“Save all results”即可把所有结果保存在本地。

结果是怎样生成的呢?中间经过了哪些步骤呢?我们可以通过”R script“生成产生结果的脚本。我们可以简单的把脚本复制粘贴到我们的R或者R studio中,即可以生成和网页版一样的结果了。

恭喜你,做完了这组样本的差异表达分析,是不是非常非常的简单哇,欢迎分享关注哟。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181013G136KE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券