专栏首页生信技能树R语言公益课程之bioconductor

R语言公益课程之bioconductor

生信分析人员如何系统入门R(2019更新版)》给初学者的六步系统入门R语言,知识点路线图如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

我们有一个《R语言公益课程之基础绘图》,虽然说绝大部分入门了R语言的朋友,都实际上根本不需要使用R语言的base函数绘图。但是其实这个绘图本身,也是可以有很多玩法。(录屏以及课程资料也是在对应的钉钉群哈,见文末)

接下来带来的是R包集合Bioconductor及高通量数据处理中数据呈现、输入输出以及大家比较关注的注释的代表性R包介绍。

Bioconductor用于分析和理解高通量基因组数据;其在统计上有严谨的方法对设计的实验进行微阵列预处理和分析,并且对生物信息学处理有综合和可重复的方法而获得了很高的可信度。

Bioconductor现含749+R包,包用于表达和其他微阵列、序列分析、流式细胞术、成像和其他领域。

课程需要的基础知识

需要自行看配套书籍《R语言之书》,理解下面的4个知识点单元:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)

课程主要的内容

1.高通量测序工作流程简介

概述

产生的数据

研究的问题

2.高通量测序数据的呈现形式

S3和S4类 用来表示更复杂的数据结构

1)表示S3和S4对象

2)如何创建S3和S4对象?

## S3对象
x <- rnorm(1000, sd=1)
y <- x + rnorm(1000, sd=.5)
fit <- lm(y ~ x) # 线性回归方程
fit #S3对象
anova(fit)
sqrt(var(resid(fit)))
class(fit)

序列数据呈现的R包

1)安装R包

2)使用实例 GenomicRanges

数据输入和输出的R包

常见数据格式简介及处理的R包 rtracklayer

3.基因和基因组注释

1)以基因为中心的R包 Org.*

2)以基因组为中心的R包 GenomicFeatures

3)以网络为基础的R包 biomaRt

## Org.*的不同物种注释的包
org.Hs.eg.db
org.Mm.eg.db
org.Rn.eg.db
org.Sc.sgd.db
org.Dm.eg.db
org.At.tair.db
org.Dr.eg.db
org.Ce.eg.db
org.Bt.eg.db
org.Gg.eg.db
org.Cf.eg.db
org.Ss.eg.db

## biomaRt进行ID转换
affyids=c("202763_at","209310_s_at","207500_at")
getBM(attributes = c('affy_hg_u133_plus_2', 'hgnc_symbol', 'chromosome_name',
                   'start_position', 'end_position', 'band'),
      filters = 'affy_hg_u133_plus_2', 
      values = affyids, 
      mart = ensembl)  

本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-05-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 所谓学习技巧无非就是善于发现规律

    很明显不同物种就是2个字符的简称即可,这个对应表格很明显是物种的拉丁名。但是在使用一个需要TxDb的R包时候,自己的物种是斑马鱼org.Dr.eg.db,请问对...

    生信技能树
  • WGCNA分析+公共数据库挖掘你感兴趣的癌症

    原文链接: Application of weighted gene co-expression network analysis to identify ke...

    生信技能树
  • RNA-seq的counts值,RPM, RPKM, FPKM, TPM 的异同

    提到了RPKM值被淘汰,很多粉丝留言表示不能理解,这里解释一下不同值的异同点。 现在常用的基因定量方法包括:RPM, RPKM, FPKM, TPM。这些表达...

    生信技能树
  • 所谓学习技巧无非就是善于发现规律

    很明显不同物种就是2个字符的简称即可,这个对应表格很明显是物种的拉丁名。但是在使用一个需要TxDb的R包时候,自己的物种是斑马鱼org.Dr.eg.db,请问对...

    生信技能树
  • org.jboss.deployers.spi.DeploymentException: Error deploying: file:/jboss/logging.xml或者vsf.xml

    When you use the JBoss 5.1.x application server, the following DEBUG messages ap...

    西门呀在吹雪
  • 一周时间解决数学界「康威扭结」难题,这个数学博士小姐姐太强悍

    4 月 12 日,当代传奇数学家、「生命游戏」发明者约翰·何顿·康威(John Horton Conway)因新冠肺炎去世,享年 82 岁。这位享誉海外的数学家...

    机器之心
  • SpringBoot集成Elasticsearch并进行增删改查操作

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    林老师带你学编程
  • 大面阵coms成像系统

    大侠好,欢迎来到FPGA技术江湖,江湖偌大,相见即是缘分。大侠可以关注FPGA技术江湖,在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源,或者一起煮酒言欢。...

    FPGA技术江湖
  • POJ 3233 Matrix Power Series(矩阵快速幂)

    Matrix Power Series Time Limit: 3000MS Memory Limit: 131072K Total Subm...

    ShenduCC
  • HDU 1575 Tr A(矩阵快速幂)

    Tr A Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java...

    ShenduCC

扫码关注云+社区

领取腾讯云代金券