R语言20练习题

今天是生信星球陪你的第108天

你想找辆共享单车,发现满街都是别家车,没有一辆你能骑。

你想学点生信,搜了“初学者教程”,满眼尽是高大上,没有一句能看懂。

终于你跨越茫茫宇宙,来到生信星球,发现了初学者的新大陆

豆豆写于2018.8.26,今天先做8道题

练习题来自生信技能树jimmy,http://www.bio-info-trainee.com/3409.html

.1 安装R包

.2 了解ExpressionSet对象

CLL包中有data(sCLLex),是一个表达芯片数据对象,其中包含许多信息!

第一行的ExpressionSet就是表达矩阵,

查看它使用 ,用 查看矩阵大小

使用str查看对象的结构,使用head查看对象的前6行(默认)

.3 安装并了解hgu95av2.db包

官网:http://www.bioconductor.org/packages/release/data/annotation/html/hgu95av2.db.html

安装

这个数据库中共有36个包,每个包都可以当成一个列表操作,可以用 函数展示数据,

探针与基因的对应关系

不管是Agilent芯片,还是Affymetrix芯片,上面设计的探针都非常短。最长的如Agilent芯片上的探针,往往都是60bp,但是往往一个基因的长度都好几Kb。因此一般多个探针对应一个基因,取最大表达值探针来作为基因的表达量

找差异:找到sCLLex表达矩阵(e)在hgu95av2.db包中没有交叉的探针

过滤掉那些没有被hgu95av2.db收录的探针

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180826G1G0G000?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券