专栏首页生信小驿站优化差异基因分析的三板斧

优化差异基因分析的三板斧

写作背景:

由于我经常下载和分析geo数据集,而由于geo数据集上的数据分布不一,标准不统一。经常会遇到的难题是,差异分析结果并不满意,包括:1差异基因太少,一个数据集坐下来,只找到几百个差异基因2热图不满意。所以我经过自己的经验和总结,找到了三种方法来优化差异分析。

示例:

  • 这是一个数据集的PCA分析图,我们发现这张图至少存在几个问题: 1样本之间有batch(批间差),似乎样本分为了两个批次、方法去测序,导致这两次测序或者芯片分析结果泾渭分明,差异非常明显。这样可能导致我们想寻找的N和T分组的差异基因受到很大的影响。 2肿瘤T和正常样本N混杂在一起,这样做差异分析是没太大意义,因为差异分析的结果肯定很差,理想的结果应该是肿瘤样本与正常样本泾渭分明
  • 经过我的所谓三板斧,三种方法和步骤,可以非常完美的将数据转化为如下所示:

我们可以发现N组样本和T组样本在PCA结果上分开了。这样做差异分析结果必然是比较令人满意的。比如说,转换以前我们只能在两组中找到300多个差异分析,而经过转换,差异分析数目达到了5000多个,差异基因数目增加了十倍不止,这就给我们后续分析提供很大的空间。此外,之前的差异分析结果比如说火山图和热图是非常难看的,尤其热图根本看不出来趋势,转换以后就非常打动且能说明问题和实验目的。

代码:

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 单基因生信分析流程(2)一文解决差异分析、基因相关分析问题

    (1)读取基因表达矩阵 (2)根据基因表达量设置样本分组 (3)设置差异倍数、生成差异分析结果 (4)绘制火山图和热图

    用户1359560
  • 重复一篇3分左右纯生信文章(第三部分)

    用户1359560
  • R语言之可视化(24)生成带P值得箱线图

    用户1359560
  • 使用seaborn绘图(一)

    seaborn是在matplotlib的基础上进行了封装和扩展,让python的数据可视化功能更加强大。

    用户6021899
  • 小朋友学C语言(1):Hello World

    首先,需要一款C语言的编译器,可以使用在线编译器,也可以在本地安装编译器,比如Mac电脑可以安装Xcode,PC可以安装Dev C++。 若是第一次编写程序,建...

    海天一树
  • 你需要知道的算法之基础篇

    腾讯NEXT学位
  • java003-错误:java.security.InvalidKeyException: Illegal key size or default parameters解决方法

    其实本质是 解决java加密解密的授权签名问题。 Java几乎各种常用加密算法都能找到对应的实现。因为美国的出口限制,Sun通过权限文件(local_poli...

    上善若水.夏
  • 企点3.3 | 电话客服新功能解锁!快来体验吧

    ? 本次企点客服-电话客服3.3版本 共计更新/优化了7个功能点 快来看看新功能在哪里/怎么用! 重点功能: 1.IVR语音导航优化 2.外呼任务支持自定义...

    腾讯企点
  • 本地git创建仓库,连接码云

    https://cloud.tencent.com/developer/article/1468179

    秋雨
  • 算法 - 程序的灵魂

    算法(Algorithm)是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。一般地,当算法在处理信息时,会从输入...

    忆想不到的晖

扫码关注云+社区

领取腾讯云代金券