承接于昨天的:30道练习题带你玩转统计学的R语言版 可视化是一门很深的学问,详解:https://mubu.com/doc/3L0wkgGUVg 这里仅仅是出题30个,引导大家进入该领域! 其实正如研究生小弟提到的,我绘图通常是靠谷歌:生信故事会之莽莽撞撞过一年
这里仅仅是针对一个数据集,就是r包airway并且通过assay函数拿到其表达矩阵。
关于 airway 代码如下,需要理解:
options(stringsAsFactors = F)
library(airway)
data(airway)
# 这里需要自行学习bioconductor里面的RangedSummarizedExperiment对象
airway
RNAseq_expr=assay(airway)
colnames(RNAseq_expr)
RNAseq_expr[1:4,1:4]
# RNAseq_expr 是一个数值型矩阵,属于连续性变量,可以探索众数、分位数和平均数 ,极差,方差和标准差等统计学指标
RNAseq_gl=colData(airway)[,3]
table(RNAseq_gl)
是 8个样本的RNA-seq数据的counts矩阵,这8个样本分成2组,每组是4个样本, 分别是 trt 和 untrt 组。
通过上面的代码,我们得到了对airway数据集的RNA-seq数据的counts矩阵,命名为 RNAseq_expr 下面会用得到。
需要参考 https://github.com/jmzeng1314/GEO/blob/master/airway_RNAseq/DEG_rnsseq.R
本习题是生信工程师全套教学视频(74小时)的一个补充
不少表现积极的朋友提交了自己的作业笔记和学习心得,非常棒!
和10万人一起学生信
3.一万人陪你学习GEO数据库挖掘知识(公益视频听课笔4.记分享)
8.B站的11套生物信息学公益视频配套讲义,练习题及思维导图第一弹
。。。此列表待你更新。。。。