前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >蛋白质组学第8期 文章复现之数据处理

蛋白质组学第8期 文章复现之数据处理

作者头像
生信技能树
发布2019-08-20 09:53:58
8.1K4
发布2019-08-20 09:53:58
举报

第七期内容我们介绍了使用Perseus 进行数据预处理,这期接着上期预处理的内容,开始数据分析。

1.聚类热图

1)Z-score normalized
Z-score 归一化

img

img

Z-Score 讲解

引用自(https://blog.csdn.net/Orange_Spotty_Cat/article/details/80312154)

Z-Score的目的:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。

实例:

A班级的平均分是80,标准差是10,A考了90分;B班的平均分是400,标准差是100,B考了600分。我们可以计算得出,A的Z-Score是1((90-80)/10),B的Z-Socre是2((600-400)/100)。因此B的成绩更为优异。反之,若A考了60分,B考了300分,A的Z-Score是-2,B的Z-Score是-1。因此A的成绩更差。

优缺点:

  • 优点:

Z-Score最大的优点就是简单,容易计算,在R中,不需要加载包,仅仅凭借最简单的数学公式就能够计算出Z-Score并进行比较。此外,Z-Score能够应用于数值型的数据,并且不受数据量级的影响,因为它本身的作用就是消除量级给分析带来的不便。

  • 缺点

但是Z-Score应用也有风险。首先,估算Z-Score需要总体的平均值与方差,但是这一值在真实的分析与挖掘中很难得到,大多数情况下是用样本的均值与标准差替代。其次,Z-Score对于数据的分布有一定的要求,正态分布是最有利于Z-Score计算的。最后,Z-Score消除了数据具有的实际意义,A的Z-Score与B的Z-Score与他们各自的分数不再有关系,因此Z-Score的结果只能用于比较数据间的结果,数据的真实意义还需要还原原值。

2) 热图

2.火山图

1) 注释数据
2)火山图
3)图片保存

修改成你想要的图片之后,点击

3.本期任务

将两种细胞的数据进行预处理,并制作热图和火山图。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第七期内容我们介绍了使用Perseus 进行数据预处理,这期接着上期预处理的内容,开始数据分析。
    • 1.聚类热图
      • 2.火山图
        • 3.本期任务
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档