前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GEO数据库可能遇到的问题 (一)

GEO数据库可能遇到的问题 (一)

作者头像
医学数据库百科
发布2020-06-15 11:31:17
2.4K0
发布2020-06-15 11:31:17
举报

昨天介绍完GEO2R之后其实该和大家说一下富集分析相关的东西了(昨日链接:GEO2R差异表达分析软件)。但是,由于GEO数据库里面的数据种类比较多,所以经常我们用的这个数据集和其他数据集有区别,所以就导致碰到这种这样的问题。这里就简单说一下我们之前碰到的一些问题吧,如果大家还有新的问题,欢迎后台留言提问~

1 这个数据集为什么没有GEO2R分析工具?

有时候我们在找到数据集,然后看了分组之后,觉得这个数据和我们想要的挺符合的。想分析的时候,发现没有GEO2R这个工具。

例如下面这个:

这个就涉及到GEO2R的使用目标了。GEO2R只适用于 表达谱芯片分析。但是GEO数据里面,并不止是包括表达谱芯片数据。还包括一些二代测序的数据。而二代的数据是不能这么简单的分析的,这也是为什么我们在第一次介绍GEO的时候,就说,现在常规的容易入门的数据分析类型还是 表达谱数据

一般我们在GEO检索结果的时候,如果可以用GEO2R分析的,都会显示。

2 GEO2R能进行多组分析嘛?

有时候我们发现一个数据集,里面包括多个不同的分组。而且我们还都感兴趣。那能进行进行多组分析嘛?

这个GEO2R里面是考虑多多组之间的分析的,我们只需要在制定分组的时候,制定自己想要的分组就行了。

只不过呢,在结果当中,我们就看不到类似logFC的计算量了。其实从统计上来说在的话,两组我们用的是非参,两组以上就是方差了。统计方式不对返回的结果就不一样了。所以结果当中会包括一个F值。

3 如果有两个数据集能一起分析嘛?

我们经常在找自己课题相关的数据的时候,经常能找到好多数据集。统计学上说,样本量越大结果越准确嘛。那能融合到一起用GEO2R分析嘛?答案是,不能。。。。

由于GEO2R是基于GEO数据库设计的,所以并没有提供上传数据分析的功能,所以这个时候就不能融合到一起来进行分析了。另外呢,就算我们有别的分析方法,比如知道如果用R语言来进行分析的话,也不能单纯的把数据集下载下来然后融合到一起分析的。因为不同数据集在做检测数据的时候,当时检测的时候温度,环境,机器的状态等因素不同,所以就导致两者之间可能存在一定的整体的偏差。我们称这种叫做批次效应。如果不去掉批次效应就硬融合到一起。那结果往往会出现很大的偏差。

所以也就是因为不能简单的进行硬融合,好多在找到相同数据集的时候,但又不想去进行去批次的操作的时候,都选了去交集的分析方式。这个也算是有一定道理的。毕竟既然两者个数据集之间是又偏差的。但是那我自己数据集内做出来的差异基因,然后再取交集就可以了吧。这也是为什么很多文章里面会有Venn图。

如果确实想融合多个数据集分析,但是又不会处理批次效应的话。那推荐我们这个帖子[数据库介绍]一站式表达谱数据分析。这个数据库可以帮我们去掉批次效应来进行差异分析的。

由于篇幅的关系,还有一些问题就放到明天再和大家说吧!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据库百科 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 这个数据集为什么没有GEO2R分析工具?
  • 2 GEO2R能进行多组分析嘛?
  • 3 如果有两个数据集能一起分析嘛?
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档