专栏首页生信技能树每月一生信流程之RNAseq123

每月一生信流程之RNAseq123

目前bioconductor社区有27个流程,早在2015/2016年我组织生信菜鸟团小伙伴建设bioconductor中文社区的时候就想系统性的学习和分享,一晃四五年过去了, 我们的bioconductor中文社区只有一个空荡荡的主页,我自己的几个笔记而已,很可惜没有能坚持下去,不过现在有数十万粉丝了,这些资料必须得强推给大家,系统性学习生物信息学的宝藏资源!

全部bioconductor流程链接在;http://www.bioconductor.org/packages/release/BiocViews.html#___GeneExpressionWorkflow

目前的27个流程,已经分门别类的整理好了,我们每个月学一个流程,预计两年就可以成为生物信息学领域的全栈工程师啦!

image-20191104223655680

今天学习RNAseq123

我们首先看看转录组领域的基因表达相关流程吧,首先一起学习 RNA-seq analysis is easy as 1-2-3 的是:http://www.bioconductor.org/packages/release/workflows/html/RNAseq123.html 实际上就是使用常见的RNA-seq差异分析包,从头到尾走流程熟悉转录组数据分析的基本知识,让我意外的是,居然是有中文版教程,实在是不能太友好了!

HTML    R Script    RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR (Chinese version)
HTML    R Script    RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR (English version)

可能是因为作者里面有不少中国人吧!

R package that supports the F1000Research workflow article on RNA-seq analysis using limma, Glimma and edgeR by Law et al. (2016).
Author: Charity Law, Monther Alhamdoosh, Shian Su, Xueyi Dong, Luyi Tian, Gordon Smyth and Matthew Ritchie

在R里面安装这个bioconductor流程

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("RNAseq123")

因为是有中文的,我就不拷贝粘贴了,大家直接去阅读即可:

  • 使用limma、Glimma和edgeR,RNA-seq数据分析易如反掌
  • http://www.bioconductor.org/packages/release/workflows/vignettes/RNAseq123/inst/doc/limmaWorkflow_CHN.html

全部目录如下;

  • 1 摘要
  • 2 背景介绍
  • 3 初始配置
  • 4 数据整合
  • 4.1 读入计数数据
  • 4.2 组织样品信息
  • 4.3 组织基因注释
  • 5 数据预处理
  • 5.1 原始数据尺度转换
  • 5.2 删除低表达基因
  • 5.3 归一化基因表达分布
  • 5.4 对样本的无监督聚类
  • 6 差异表达分析
  • 6.1 创建设计矩阵和对比
  • 6.2 从表达计数数据中删除异方差
  • 6.3 拟合线性模型以进行比较
  • 6.4 检查DE基因数量
  • 6.5 从上到下检查单个DE基因
  • 6.6 差异表达结果的实用图形表示
  • 7 使用camera的基因集检验
  • 8 使用到的软件和代码

学习这样的流程是需要一定背景知识的

首先是LINUX学习

我在《生信分析人员如何系统入门Linux(2019更新版)》把Linux的学习过程分成6个阶段 ,提到过每个阶段都需要至少一天以上的学习:

  • 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
  • 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
  • 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不在神秘!
  • 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量
  • 第5阶段:任务提交及批处理,脚本编写解放你的双手
  • 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我

然后是R学习

我在在生信分析人员如何系统入门R(2019更新版) 里面给初学者的知识点路线图如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 生信分析流程构建的几大流派

    构建生信分析流程是生物信息学从业人员必备的技能之一,对该项能力的评估常常是各大公司招录人员的参考项目之一。

    生信技能树
  • 都2020年了你还在用tophat吗(RNA-seq数据免费分析)

    如果你现在(2020)做人类数据分析,比如lncRNA的鉴定啥的,当然是走hisat2+stringTie流程啦,取代已经十多年了的tophat+Cufflin...

    生信技能树
  • 比对NR库看看物种分布【直播】我的基因组88

    前面我提前了我的基因组测序数据里面的未成功比对到人类基因组上面的那些fastq序列,也用了软件把它们组装成fasta序列,这些序列的功能是未知的,可以通过比对到...

    生信技能树
  • SpringCloud实战: Feign<上>

    很多使用spring cloud 主要是注册中心,动态配置中心,服务调用,负载均衡,熔断,网关。Feign是一个声明式的Web Service客户端,整合了注解...

    用户4143945
  • 虚拟主机和云服务器怎么选?

    虚拟主机已经有了一段时间的历史,近几年随着其技术的不断成熟,以及其低廉的价格,成为众多站长的首选对象。但近两年云计算的出现,衍生出云服务器这个产物。这时,很多站...

    尊托云数
  • 吴恩达的离职是中国AI发展的一个挫折?

    人工智能现在是科技行业的热门领域,它牵扯到了无人车、语音助手等下一波创收机遇。在这一领域,中国还落后于西方。由于国内缺乏高水平人才,中国科技巨头都在大力招募谷歌...

    机器人网
  • wordpress文章内添加按钮

    谷腾堡编辑器自带,提取出平时使用经典编辑器方便使用。理论高版本的wordpress都可以用吧。字体颜色也可以更改,用到了再去谷腾堡拿吧!

    AlexTao
  • 虚拟主机和云服务器怎么选?

    虚拟主机已经有了一段时间的历史,近几年随着其技术的不断成熟,以及其低廉的价格,成为众多站长的首选对象。但近两年云计算的出现,衍生出云服务器这个产物。这时,很多站...

    用户6429551
  • HTML‘冷’知识总结

    声明:本文为原创,作者为 对弈,转载时请保留本声明及附带文章链接:http://www.duiyi.xyz/c%e5%ae%9e%e7%8e%b0%e9%9b%...

    对弈
  • python基础----函数作为返回值

    从一个例子讲起 高阶函数除了可以接受函数作为参数外,还可以把函数作为结果值返回。 还是考虑这个问题:对可变参数进行求和 看了上一讲的已经知道,可以使用’*’...

    GavinZhou

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动