今天是生信星球陪你的第108天
你想找辆共享单车,发现满街都是别家车,没有一辆你能骑。
你想学点生信,搜了“初学者教程”,满眼尽是高大上,没有一句能看懂。
终于你跨越茫茫宇宙,来到生信星球,发现了初学者的新大陆
豆豆写于2018.8.26,今天先做8道题
练习题来自生信技能树jimmy,http://www.bio-info-trainee.com/3409.html
.1 安装R包
.2 了解ExpressionSet对象
CLL包中有data(sCLLex),是一个表达芯片数据对象,其中包含许多信息!
第一行的ExpressionSet就是表达矩阵,
查看它使用 ,用 查看矩阵大小
使用str查看对象的结构,使用head查看对象的前6行(默认)
.3 安装并了解hgu95av2.db包
官网:http://www.bioconductor.org/packages/release/data/annotation/html/hgu95av2.db.html
安装
这个数据库中共有36个包,每个包都可以当成一个列表操作,可以用 函数展示数据,
探针与基因的对应关系
不管是Agilent芯片,还是Affymetrix芯片,上面设计的探针都非常短。最长的如Agilent芯片上的探针,往往都是60bp,但是往往一个基因的长度都好几Kb。因此一般多个探针对应一个基因,取最大表达值探针来作为基因的表达量
找差异:找到sCLLex表达矩阵(e)在hgu95av2.db包中没有交叉的探针
过滤掉那些没有被hgu95av2.db收录的探针
领取专属 10元无门槛券
私享最新 技术干货