专栏首页生信技能树蛋白质组学第8期 文章复现之数据处理

蛋白质组学第8期 文章复现之数据处理

第七期内容我们介绍了使用Perseus 进行数据预处理,这期接着上期预处理的内容,开始数据分析。

1.聚类热图

1)Z-score normalized

Z-score 归一化

img

img

Z-Score 讲解

引用自(https://blog.csdn.net/Orange_Spotty_Cat/article/details/80312154)

Z-Score的目的:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。

实例:

A班级的平均分是80,标准差是10,A考了90分;B班的平均分是400,标准差是100,B考了600分。我们可以计算得出,A的Z-Score是1((90-80)/10),B的Z-Socre是2((600-400)/100)。因此B的成绩更为优异。反之,若A考了60分,B考了300分,A的Z-Score是-2,B的Z-Score是-1。因此A的成绩更差。

优缺点:

  • 优点:

Z-Score最大的优点就是简单,容易计算,在R中,不需要加载包,仅仅凭借最简单的数学公式就能够计算出Z-Score并进行比较。此外,Z-Score能够应用于数值型的数据,并且不受数据量级的影响,因为它本身的作用就是消除量级给分析带来的不便。

  • 缺点

但是Z-Score应用也有风险。首先,估算Z-Score需要总体的平均值与方差,但是这一值在真实的分析与挖掘中很难得到,大多数情况下是用样本的均值与标准差替代。其次,Z-Score对于数据的分布有一定的要求,正态分布是最有利于Z-Score计算的。最后,Z-Score消除了数据具有的实际意义,A的Z-Score与B的Z-Score与他们各自的分数不再有关系,因此Z-Score的结果只能用于比较数据间的结果,数据的真实意义还需要还原原值。

2) 热图

2.火山图

1) 注释数据

2)火山图

3)图片保存

修改成你想要的图片之后,点击

3.本期任务

将两种细胞的数据进行预处理,并制作热图和火山图。

本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-08-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • TPM格式搜索错了,好尴尬

    通常情况下我会使用 featureCounts 得到表达矩阵是 raw counts, 但总是有人需要我转换成各种形式,比如 RPKM, FPKM and TP...

    生信技能树
  • 3大在线分析工具:Enrichr、WebGestalt、gprofiler与R包clusterprofiler的比较

    WebGestalt同样是高引用率富集分析工具,现引用量超过 2,500(几版加起来),支持3种算法进行富集:

    生信技能树
  • ROC的计算与绘制

    最近工作需要绘制ROC曲线,对该曲线的计算细节进行了一番摸索。当前搜索ROC曲线一般跟机器学习相关联,导致我对它的概念有了曲解,理所当然地以为它只是一个用于机器...

    生信技能树
  • mysql 查询出成绩表排名,两种实现方式

    lop
  • 05.记录合并&字段合并&字段匹配1.记录合并2.字段合并3.字段匹配3.1 默认只保留连接上的部分3.2 使用左连接3.3 使用右连接3.4 保留左右表所有数据行

    将两个结构相同的数据框合并成一个数据框。 函数concat([dataFrame1, dataFrame2, ...])

    用户1250179
  • C++之类(一)

    在C++之中,我们使用类来定义自己的数据类型。通过自定义数据类型,可以使我们的编程变得更加方便。或者说C++设计类的目的就是为了使我们可以像使用基本数据类型一样...

    zy010101
  • iOS下WebRTC视频解码

    今天介绍一下 iOS下WebRTC 是如何进行视频解码的。关于iOS下WebRTC视频采集与编码可以看下面的文章:

    音视频_李超
  • Python内置函数

    内置函数之一:lambda表达式 前面知识回顾: 三目运算: #普通条件语句 1: if 1 == 1: 2: name ='曹小贱' 3:...

    洗尽了浮华
  • 如何设计一个高可用系统?要考虑哪些地方?

    高可用描述的是一个系统在大部分时间都是可用的,可以为我们提供服务的。高可用代表系统即使在发生硬件故障或者系统升级的时候,服务仍然是可用的。

    Guide哥
  • python笔记12

    林祈

扫码关注云+社区

领取腾讯云代金券