连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!大家开始根据我的ngs组学视频进行一系列公共数据集分析实战,其中几个小伙伴让我非常惊喜,不需要怎么沟通和指导,就默默的完成了一个实战!
他前面的分享是:
下面是他对我们b站转录组视频课程的详细笔记
进行RNA-seq入门实战首先需要有一定的linux与R基础,推荐跟着B站生信技能树-jimmy老师学习打牢基础: 【生信技能树】生信人应该这样学linux(更新至第14集)_哔哩哔哩_bilibili
【生信技能树】生信人应该这样学R语言_哔哩哔哩_bilibili
运行Linux系统一般使用服务器或者个人电脑的虚拟机(Virtualbox、VMware)和子系统,下面简单介绍Windows子系统的安装配置,详细说明请参阅Windows子系统WSL的体验与配置——Ubuntu-22.04
su
cd /etc/apt/
cp sources.list sources.list.bak
vim sources.list
Ubuntu版本 22.04 LTS的设置(注意要找到对应的Ubuntu版本设置)如下:
# 默认注释了源码镜像以提高 apt update 速度,如有需要可自行取消注释
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse
# 预发布软件源,不建议启用
# deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multivers
sudo apt update #更新可用软件包列表
sudo apt upgrade #更新已安装的包
一般使用Mniconda3软件进行创建分析环境和管理软件,下面简单介绍Mniconda3的安装,其详细使用说明请参阅Miniconda3的安装、配置和使用
wget https://mirrors.ustc.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
#wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda-latest-Linux-x86_64.sh
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/pro conda config --add
channels https://mirrors.ustc.edu.cn/anaconda/pkgs/r conda config --add channels
https://mirrors.ustc.edu.cn/anaconda/pkgs/free conda config --add channels
https://mirrors.ustc.edu.cn/anaconda/pkgs/main conda config --add channels
https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda conda config --add channels
https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge conda config --set show_channel_urls yes
conda create -n rna_p3 python=3 sra-tools
conda env list #查看环境
conda activate rna_p3 #进入conda 环境
conda deactivate #退出当前conda环境
质控清洗:fastqc multiqc trim-galore 比对计数:hisat2 subread samtools=1.6 salmon
注意,安装使用R首先需要你的电脑用户名不能含有中文,否则后期运行程序会很容易报错,如果用户名含有中文请进行更改(很难。。。)或新建一个用户; Rstudio是R的编译器,能提升用户交互体验,安装Rstudio前一定要先安装R
新建一个Rscript,运行以下内容,下载Bioconductor和本次实战所需所有R包等,代码修改自jimmy老师
###Bioconductor 下载
install.packages("BiocManager")
###设置好清华镜像
rm(list = ls())
options()$repos
options()$BioC_mirror
#options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options()$repos options()$BioC_mirror
###安装需要的包
BiocManager::install(c("GSEABase","GSVA","msigdbr","clusterProfiler" ),ask = F,update = F)
BiocManager::install(c("GEOquery","limma","impute" ),ask = F,update = F)
BiocManager::install(c("org.Hs.eg.db","org.Mm.eg.db"),ask = F,update = F)
BiocManager::install(c("DESeq2","edgeR" ),ask = F,update = F) BiocManager::install("enrichplot",ask = F,update = F)
BiocManager::install("devtools",ask = F,update = F) BiocManager::install("WGCNA",ask = F,update = F)
BiocManager::install("data.table",ask = F,update = F) BiocManager::install("tximport",ask = F,update = F)
BiocManager::install("tidyverse",ask = F,update = F) BiocManager::install("DOSE",ask = F,update = F)
BiocManager::install("patchwork",ask = F,update = F) BiocManager::install("RBGL",ask = F,update = F) #Vennerable依赖包
BiocManager::install("pathview",ask = F,update = F)
BiocManager::install(c("STRINGdb","ggraph","igraph"),ask = F,update = F)
install.packages("Vennerable", repos="http://R-Forge.R-project.org") #安装Vennerable包
install.packages("statmod") #其他一些基础包安装
options()$repos
install.packages(c("FactoMineR", "factoextra"))
install.packages(c("ggplot2", "pheatmap","ggpubr","ggthemes",
"ggstatsplot","ggsci","ggsignif"))
install.packages("rvcheck") (.packages()) #查看当前加载运行包
#更新所有包
rvcheck::update_all(check_R = F, which = c("CRAN", "BioC", "github"))
#bioconductor | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
file.edit('~/.Rprofile')
输入以下内容:
# 清华源的镜像
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")
以上就是进行RNA-seq流程前的全部准备了,下一步就可以开始进行上游数据下载、格式转化和质控清洗等步骤啦
参考资料
GitHub - jmzeng1314/GEO (强烈推荐学习)
【生信技能树】生信人应该这样安装软件_哔哩哔哩_bilibili
【生信技能树】生信分析入门环境搭建_哔哩哔哩_bilibili