专栏首页liu_ll的生信学习笔记R语言----PCA分析,热图(楔子)

R语言----PCA分析,热图(楔子)

在转录组的分析当中,主成分分析(PCA)往往是成果体现的一个很重要的手段。 在《R语言做主成分分析实例》里的降解非常的好--网址 :https://shengxin.ren/article/84 定义:主成分分析法是数据挖掘中常用的一种降维算法,是Pearson在1901年提出的,再后来由hotelling在1933年加以发展提出的一种多变量的统计方法,其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异,也可以用来削减回归分析和聚类分析中变量的数目,与因子分析类似。(说实话是在是没啥用,看不懂) 举个栗子: 比如你要做一项分析人的肥胖的因素有哪些,这时你设计了50个你觉得都很重要的指标,然而这50个指标对于你的分析确实太过繁杂,这时你就可以采用主成分分析的方法进行降维。50个指标之间会有这样那样的联系,相互之间会有影响,通过主成分分析后,得到三五个主成分指标。此时,这几个主成分指标既涵盖了你50个指标中的绝大部分信息,这让你的分析得到了简化(从50维降到3、5维)。 -------------------------分割线---------------------------------------------------------------------------------------------------- 学习的过程是来自于B站孟浩巍的系列视频2017-08-04-高通量测序技术交流录像https://www.bilibili.com/video/av12969326 先附上这次学习的主成分分析的代码

rm(list=ls())
combine_fpkm_table <- read.csv("./diffexpr_resultsfor_TNBC18_VS_para10.csv",header = T,sep = ',')
dim(combine_fpkm_table)                                 
input_matrix <- combine_fpkm_table[,c(2:ncol(combine_fpkm_table))]
#princomp(input_matrix) not used often 

library(psych)
input_matrix <- combine_fpkm_table[,c(2:ncol(combine_fpkm_table))]
pca_result <- principal(input_matrix,nfactors = 3) #一般主成分不能超过5个,一般是2,3个
pca_result$values  #每个算法的评分?
pca_result$scores   #每个基因的权重
pca_result$weights  #具体的数值

plot(pca_result$scores[,1],pca_result$scores[,3],xlim = c(0,50),ylim = c(0,50))

PCA分析的结果,取第一个和第三个主成分分析的因子

接下来还有一个热图的代码

library(pheatmap)
input_table = combine_fpkm_table[,c(2:ncol(combine_fpkm_table))]
pheatmap(log2(input_table[c(1:500),] +1))  #取了前面500行

热图结果

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 文档处理之行列筛选

    新手小白(就是我),在处理文件的时候发了愁,师兄给了我一个文件,让我先筛选出来diff>0.2 和p <0.05的行列出来,然后根据这个进行秩和检验。 (本来...

    liu_ll
  • 什么是Repli-seq?

      最近接触到一个新的测序method:Repli-seq!这篇笔记就是为了学习和思考浅层思考Repli-seq

    liu_ll
  • BBQ(生信基础问题6-10问):Fastqc专题

    (今天实验比较顺,爆一波RP, 实验永远是玄学。。。。。。。再次努力更新中!一起加油学生信呀~) :在学习笔记(一)中,我们知道了一代测序,二代测序的测序原...

    liu_ll
  • python中的global和nonl

    与其它的编程语言相同,在函数中声明的变量都是local变量。作用域仅限于函数中,从函数外是访问不到的。

    用户2398817
  • 记一次mykings&暗云挖矿木马的排查与解决

    之前有一台做测试的Windows server2012阿里云服务器的防火墙关掉之后开机总是启动,想了很多办法也没找到原因就提了工单问了售后,结果售后也没发现问题...

    没有故事的陈师傅
  • TensorFlow-4: tf.contrib.learn 快速入门

    学习资料: https://www.tensorflow.org/get_started/tflearn 相应的中文翻译: http://studyai.s...

    杨熹
  • UINavigationController 导航控制器概念属性方法

    用户2141756
  • 《Restlet Client》优秀的Api测试工具

    Restlet Client是一个类似Postman的Api测试工具, 界面比Postman更现代化一些, UI布局也更合理一些, 非常适合程序员们自测接口, ...

    zhaoolee
  • .NET-记一次架构优化实战与方案-前端优化

      上一篇《.NET-记一次架构优化实战与方案-梳理篇》整理了基本的业务知识,同时也罗列了存在的问题,本篇主要是针对任务列表的页面进行性能优化。

    陈珙
  • 目前最强性能的人脸检测算法(Wider Face Dataset)

    《月令七十二候集解》:“二月中,分者半也,此当九十日之半,故谓之分。秋同义。”《春秋繁露·阴阳出入上下篇》说:“春分者,阴阳相半也,故昼夜均而寒暑平。”

    计算机视觉战队

扫码关注云+社区

领取腾讯云代金券