前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >优化差异基因分析的三板斧

优化差异基因分析的三板斧

作者头像
用户1359560
发布2020-05-08 17:00:27
5451
发布2020-05-08 17:00:27
举报
文章被收录于专栏:生信小驿站生信小驿站

写作背景:

由于我经常下载和分析geo数据集,而由于geo数据集上的数据分布不一,标准不统一。经常会遇到的难题是,差异分析结果并不满意,包括:1差异基因太少,一个数据集坐下来,只找到几百个差异基因2热图不满意。所以我经过自己的经验和总结,找到了三种方法来优化差异分析。

示例:

  • 这是一个数据集的PCA分析图,我们发现这张图至少存在几个问题: 1样本之间有batch(批间差),似乎样本分为了两个批次、方法去测序,导致这两次测序或者芯片分析结果泾渭分明,差异非常明显。这样可能导致我们想寻找的N和T分组的差异基因受到很大的影响。 2肿瘤T和正常样本N混杂在一起,这样做差异分析是没太大意义,因为差异分析的结果肯定很差,理想的结果应该是肿瘤样本与正常样本泾渭分明
  • 经过我的所谓三板斧,三种方法和步骤,可以非常完美的将数据转化为如下所示:

我们可以发现N组样本和T组样本在PCA结果上分开了。这样做差异分析结果必然是比较令人满意的。比如说,转换以前我们只能在两组中找到300多个差异分析,而经过转换,差异分析数目达到了5000多个,差异基因数目增加了十倍不止,这就给我们后续分析提供很大的空间。此外,之前的差异分析结果比如说火山图和热图是非常难看的,尤其热图根本看不出来趋势,转换以后就非常打动且能说明问题和实验目的。

代码:

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 写作背景:
  • 示例:
  • 代码:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档