前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >不要看数量,要看质量

不要看数量,要看质量

作者头像
生信技能树
发布2020-07-02 14:49:56
2930
发布2020-07-02 14:49:56
举报

前面我们组建了:免费视频课程《RNA-seq数据分析》交流群 ,很多人马上学习了全套实战视频,并且实践了一个转录组项目流程,新手问的最多的问题是:为什么我给的RNA-seq表达矩阵代码需要的是counts格式输入,而且使用3个不同的R包做差异分析,这3个R包该分别如何设置阈值来进行统计学显著的差异表达基因筛选,以及多个R包数量有时候差异很大,该如何取舍。

我的回答,统一是:不要看数量,要看质量!!!

早在教程:RNA芯片和测序技术的比较(学徒作业),我其实就提出来了,比较同样实验设计的两个表达量探索研究,一个研究使用的是芯片,一个是测序,看看两者的差异基因情况的overlap情况,这样的策略其实是太粗糙了。正确的做法应该是看两次差异分析的基因的logFC的散点图,如下:

两次差异分析的基因的logFC的散点图

而且你可以进行更细致的探索,我们这里以文章:《RNA sequencing atopic dermatitis transcriptome profiling provides insights into novel disease mechanisms with potential therapeutic implications》为例子:

比如把基因按照表达量划分高中低三组,后再去看表达量相关性:

表达量分组后看相关性

再比如选取那些两次差异不统一的基因进行后续功能富集,看看那些基因是否有很多生物学意义。

结果不稳定的基因的注释

这样的探索才是合格的,首先要搞清楚流程,然后搞清楚流程里面的哪些细节是可以调整的, 而且理解调整前后的结果的变化的差异程度能够被接受与否。

以及如何论证不同流程,不同软件,不同参数,不同阈值的结果的差异背后的生物学意义。多做一些实战项目是有助于你理解差异分析的作用和本质

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档