前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >RNA-seq入门实战(零):RNA-seq流程前的准备——Linux与R的环境创建

RNA-seq入门实战(零):RNA-seq流程前的准备——Linux与R的环境创建

作者头像
生信技能树
发布2022-06-27 21:21:21
2.3K0
发布2022-06-27 21:21:21
举报
文章被收录于专栏:生信技能树生信技能树

连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!大家开始根据我的ngs组学视频进行一系列公共数据集分析实战,其中几个小伙伴让我非常惊喜,不需要怎么沟通和指导,就默默的完成了一个实战!

他前面的分享是:

下面是他对我们b站转录组视频课程的详细笔记

前言:

进行RNA-seq入门实战首先需要有一定的linux与R基础,推荐跟着B站生信技能树-jimmy老师学习打牢基础: 【生信技能树】生信人应该这样学linux(更新至第14集)_哔哩哔哩_bilibili

【生信技能树】生信人应该这样学R语言_哔哩哔哩_bilibili

本节概览:

  1. Linux下RNA-seq环境创建: Ubuntu子系统下载安装、Mniconda3与上游分析软件下载
  2. R下RNA-seq环境创建 R与Rstudio下载安装、Bioconductor与R包下载

1. Linux环境设置

1.1 Linux系统的创建——Ubuntu

运行Linux系统一般使用服务器或者个人电脑的虚拟机(Virtualbox、VMware)和子系统,下面简单介绍Windows子系统的安装配置,详细说明请参阅Windows子系统WSL的体验与配置——Ubuntu-22.04

  • Ubuntu子系统的下载安装 首先在win10中搜索“ 启用或关闭Windows功能 ”,进入该程序,勾选“适用于Linux的Windows子系统”;之后去微软商店搜索Ubuntu下载安装,一般安装默认版本或者最新的22.04LTS
  • 用户权限设置 设置好用户名和密码进入Ubuntu后,需要设置一下用户权限 启用root需要设置密码:sudo passwd root 添加用户至root组:usermod -aG sudo username 切换root用户:su 退出root:exit
  • 软件镜像源设置 一般选择国内的清华镜像,ubuntu | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror,Ubuntu 的软件源配置文件是 /etc/apt/sources.list。将系统自带的该文件做个备份,再编辑(* 注意要先切换为root用户*才能编辑该文件)
代码语言:javascript
复制
su 
cd /etc/apt/ 
cp sources.list sources.list.bak 
vim sources.list

Ubuntu版本 22.04 LTS的设置(注意要找到对应的Ubuntu版本设置)如下:

代码语言:javascript
复制
# 默认注释了源码镜像以提高 apt update 速度,如有需要可自行取消注释 
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse 
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse 
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse 
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse 
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse 
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse 
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse 
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse 
# 预发布软件源,不建议启用 
# deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multiverse 
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multivers
  • 更新一下所有软件
代码语言:javascript
复制
sudo  apt update       #更新可用软件包列表 
sudo  apt upgrade      #更新已安装的包

1.2 Mniconda3下载安装

一般使用Mniconda3软件进行创建分析环境和管理软件,下面简单介绍Mniconda3的安装,其详细使用说明请参阅Miniconda3的安装、配置和使用

  • 下载与安装 切换到安装位置(一般为主目录~), 下载最新的miniconda3,bash启动安装,一直enter、yes就可以了。
代码语言:javascript
复制
wget https://mirrors.ustc.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
#wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh 
bash  Miniconda-latest-Linux-x86_64.sh
  • 设置conda软件镜像源 依次输入以下命令设置软件镜像源,并展示镜像源地址,这里设置了中科大镜像:
代码语言:javascript
复制
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/pro conda config --add 
channels https://mirrors.ustc.edu.cn/anaconda/pkgs/r conda config --add channels 
https://mirrors.ustc.edu.cn/anaconda/pkgs/free conda config --add channels 
https://mirrors.ustc.edu.cn/anaconda/pkgs/main conda config --add channels 
https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda conda config --add channels 
https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge conda config  --set show_channel_urls yes
  • 创建分析环境 创建rna流程环境rna_p3,指定python版本为3,同时下载sra-tools 软件,之后每次要运行rna流程都要进入该环境
代码语言:javascript
复制
conda create -n rna_p3 python=3 sra-tools                
conda env list                                         #查看环境
conda activate rna_p3                                  #进入conda 环境 
conda deactivate                                    #退出当前conda环境
  • 上游分析软件下载 本次RNA-seq流程涉及软件如下所示,使用conda install -y 软件名=版本号依次进行下载即可,可同时下载多个软件,但不建议同时下载太多,容易报错

质控清洗:fastqc multiqc trim-galore 比对计数:hisat2 subread samtools=1.6 salmon


2. R环境设置

注意,安装使用R首先需要你的电脑用户名不能含有中文,否则后期运行程序会很容易报错,如果用户名含有中文请进行更改(很难。。。)或新建一个用户; Rstudio是R的编译器,能提升用户交互体验,安装Rstudio前一定要先安装R

2.1 R与Rstudio下载安装

  • 先在清华镜像源下载 R,地址:The Comprehensive R Archive Network (tsinghua.edu.cn), 依次进入:Download R for Windows——base——Previous releases; 一般选择下载R 4.1.3,使用最新版可能会有不适配的问题,使用默认选项一直确定安装即可
  • 安装好 R后之后,再去Rstudio官网下载Rstudio,地址:Download the RStudio IDE - RStudio
  • Rstudio中设置清华镜像源 依次进入:Tools——Global Options——Pakages——Change;选择镜像源

2.2 Bioconductor与R包下载

新建一个Rscript,运行以下内容,下载Bioconductor和本次实战所需所有R包等,代码修改自jimmy老师

代码语言:javascript
复制
###Bioconductor 下载 
install.packages("BiocManager")  

###设置好清华镜像
rm(list = ls())    
options()$repos  
options()$BioC_mirror 
#options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")  options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/") 
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options()$repos  options()$BioC_mirror 
###安装需要的包
BiocManager::install(c("GSEABase","GSVA","msigdbr","clusterProfiler" ),ask = F,update = F) 
BiocManager::install(c("GEOquery","limma","impute" ),ask = F,update = F) 
BiocManager::install(c("org.Hs.eg.db","org.Mm.eg.db"),ask = F,update = F) 
BiocManager::install(c("DESeq2","edgeR" ),ask = F,update = F) BiocManager::install("enrichplot",ask = F,update = F) 
BiocManager::install("devtools",ask = F,update = F) BiocManager::install("WGCNA",ask = F,update = F) 
 BiocManager::install("data.table",ask = F,update = F) BiocManager::install("tximport",ask = F,update = F) 
BiocManager::install("tidyverse",ask = F,update = F) BiocManager::install("DOSE",ask = F,update = F) 
BiocManager::install("patchwork",ask = F,update = F) BiocManager::install("RBGL",ask = F,update = F) #Vennerable依赖包
BiocManager::install("pathview",ask = F,update = F) 
BiocManager::install(c("STRINGdb","ggraph","igraph"),ask = F,update = F) 
install.packages("Vennerable", repos="http://R-Forge.R-project.org") #安装Vennerable包 
install.packages("statmod") #其他一些基础包安装 
options()$repos  
install.packages(c("FactoMineR", "factoextra"))  
install.packages(c("ggplot2", "pheatmap","ggpubr","ggthemes",
                    "ggstatsplot","ggsci","ggsignif")) 
install.packages("rvcheck") (.packages())  #查看当前加载运行包 

#更新所有包 
rvcheck::update_all(check_R = F,  which = c("CRAN", "BioC", "github"))
  • 永久设置bioconductor镜像
代码语言:javascript
复制
#bioconductor | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 
file.edit('~/.Rprofile')

输入以下内容:

代码语言:javascript
复制
# 清华源的镜像 
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")

以上就是进行RNA-seq流程前的全部准备了,下一步就可以开始进行上游数据下载、格式转化和质控清洗等步骤啦

参考资料

GitHub - jmzeng1314/GEO (强烈推荐学习)

【生信技能树】生信人应该这样安装软件_哔哩哔哩_bilibili

【生信技能树】生信分析入门环境搭建_哔哩哔哩_bilibili

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-06-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言:
  • 本节概览:
  • 1. Linux环境设置
    • 1.1 Linux系统的创建——Ubuntu
      • 1.2 Mniconda3下载安装
      • 2. R环境设置
        • 2.1 R与Rstudio下载安装
          • 2.2 Bioconductor与R包下载
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档