《生信分析人员如何系统入门R(2019更新版)》给初学者的六步系统入门R语言,知识点路线图如下:
我们有一个《R语言公益课程之基础绘图》,虽然说绝大部分入门了R语言的朋友,都实际上根本不需要使用R语言的base函数绘图。但是其实这个绘图本身,也是可以有很多玩法。(录屏以及课程资料也是在对应的钉钉群哈,见文末)
接下来带来的是R包集合Bioconductor及高通量数据处理中数据呈现、输入输出以及大家比较关注的注释的代表性R包介绍。
Bioconductor用于分析和理解高通量基因组数据;其在统计上有严谨的方法对设计的实验进行微阵列预处理和分析,并且对生物信息学处理有综合和可重复的方法而获得了很高的可信度。
Bioconductor现含749+R包,包用于表达和其他微阵列、序列分析、流式细胞术、成像和其他领域。
需要自行看配套书籍《R语言之书》,理解下面的4个知识点单元:
概述
产生的数据
研究的问题
S3和S4类 用来表示更复杂的数据结构
1)表示S3和S4对象
2)如何创建S3和S4对象?
## S3对象 x <- rnorm(1000, sd=1) y <- x + rnorm(1000, sd=.5) fit <- lm(y ~ x) # 线性回归方程 fit #S3对象 anova(fit) sqrt(var(resid(fit))) class(fit)
序列数据呈现的R包
1)安装R包
2)使用实例 GenomicRanges
数据输入和输出的R包
常见数据格式简介及处理的R包 rtracklayer
1)以基因为中心的R包 Org.*
2)以基因组为中心的R包 GenomicFeatures
3)以网络为基础的R包 biomaRt
## Org.*的不同物种注释的包 org.Hs.eg.db org.Mm.eg.db org.Rn.eg.db org.Sc.sgd.db org.Dm.eg.db org.At.tair.db org.Dr.eg.db org.Ce.eg.db org.Bt.eg.db org.Gg.eg.db org.Cf.eg.db org.Ss.eg.db ## biomaRt进行ID转换 affyids=c("202763_at","209310_s_at","207500_at") getBM(attributes = c('affy_hg_u133_plus_2', 'hgnc_symbol', 'chromosome_name', 'start_position', 'end_position', 'band'), filters = 'affy_hg_u133_plus_2', values = affyids, mart = ensembl)
本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树
原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。
原始发表时间:2020-05-19
本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。
我来说两句