专栏首页菜鸟学数据分析之R语言gcRMA算法-聚类分析图/PCA图

gcRMA算法-聚类分析图/PCA图

2017.12.31

>source("https://bioconductor.org/biocLite.R")

> biocLite("gcrma")

> biocLite("affycoretools")

> biocLite("graph")

> library(gcrma)

> library(graph)

> library(affycoretools)

> data("CLLbatch")

> data("disease")

> CLLgcrma<-gcrma(CLLbatch)

#使用gcrma算法预处理数据

> eset <- exprs(CLLgcrma)#提取基因表达矩阵

> pearson_cor <- cor(eset)#计算样品两两之间的pearson相关系数

>dist.lower<as.dist(1pearson_cor)#得到Pearson距离的下三角矩阵

>hc<-hclust(dist.lower,"ave")#聚类分析

> plot(hc)#聚类画图

> sampleNames <- sub(pattern = "\\.CLL",replacement = "",colnames(eset))#PCA分析

> groups <- factor(disease[,2])

>plotPCA(eset,addtext=sampleNames,gruops=groups,groupnames=levels(groups))

获取 disease数据列表

> disease

SampleID Disease

1 CLL10 <NA>

2 CLL11 progres.

3 CLL12 stable

4 CLL13 progres.

5 CLL14 progres.

6 CLL15 progres.

7 CLL16 progres.

8 CLL17 stable

9 CLL18 stable

10 CLL19 progres.

11 CLL1 stable

12 CLL20 stable

13 CLL21 progres.

14 CLL22 stable

15 CLL23 progres.

16 CLL24 stable

17 CLL2 stable

18 CLL3 progres.

19 CLL4 progres.

20 CLL5 progres.

21 CLL6 progres.

22 CLL7 progres.

23 CLL8 progres.

24 CLL9 stable

从上述列表信息可知稳定组和恶化组,从聚类分析可知,稳定组和恶化组根本就不能很好的分开,理论上,如果两组数据总体上是分开的,说明导致癌症从稳定到恶化的因素起到主导作用。如果不是,可能存在其他因素,比如个体差异。通过采用两个主成分构建分类图,可以看出稳定组(矩形)和恶化组(菱形)根本不能很好分开,在主成分分析时,考虑两个组成分的代表性以及累计贡献率,若低于60%,需要采用多维尺度分析

本文分享自微信公众号 - 菜鸟学数据分析之R语言(lxl915746437),作者:作者:刘晓雪

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-01-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • R语言-饼图和线图的起源

    “这易如反掌,”他说,“我看到你左脚穿的那只鞋的内侧,也就是炉火刚好照到的地方,皮面上有六道几乎平行的划痕。显然,这些划痕是有人为了去掉沾在鞋跟...

    黑妹的小屋
  • TCGA生存分析-单基因

    times bcr_patient_barcode patient.vital_status

    黑妹的小屋
  • pheatmap绘制热图

    画热图的包有很多个,热图的绘制是作为科研人员的基本素养,绘制热图的包我知道的有5个,heatmap函数、ggplot2包、gplot包、lattice包。今天初...

    黑妹的小屋
  • “照骗”难逃Adobe的火眼金睛——用机器学习让P图无所遁形

    用户1737318
  • “照骗”难逃Adobe的火眼金睛——用机器学习让P图无所遁形

    【导读】下图是 2008 年伊朗政府发布的一张图片,然而强大的网友们却凭借着肉眼,看出来图中黄色圈出的部分和红色圈出的部分是一模一样的,不得不说网友们真的是火眼...

    AI科技大本营
  • 一起来学matlab-matlab学习笔记8 基本绘图命令_1 图形窗口简介

    本文为matlab自学笔记的一部分,之所以学习matlab是因为其真的是人工智能无论是神经网络还是智能计算中日常使用的,非常重要的软件。也许最近其带来的一...

    DrawSky
  • 利用 Timescape 做肿瘤进化鱼图

    前面我们使用 pyclone 分析了肿瘤样本的 clusters 结构,接下来我们进一步分析肿瘤进化,画一个鱼图,需要用到的工具是 citup 和 Timesc...

    生信菜鸟团
  • MySQL安装教程

    链接:https://pan.baidu.com/s/1eKcAUi0ICyOG60XyS8PkDw 密码:xacu

    我被狗咬了
  • KiTS19——肾肿瘤分割挑战赛(七)

    上一篇分享了VNet改进模型——AttentionGatedVNet网络,今天将继续分享VNet改进模型NestedVNet(VNet++)网络。

    医学处理分析专家
  • AppScan扫描的测试报告结果,你有仔细分析过吗

    通过 IIS 6 引入的 HTTP 协议堆栈 (HTTP.sys) 错误地解析了特制的 HTTP 请求。因此,远程攻击者可能执行拒绝服务供给,并可在系统帐户的环...

    软件测试君

扫码关注云+社区

领取腾讯云代金券