前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >实操分享-使用MAGeCK分析Bulk CRISPR Screen数据

实操分享-使用MAGeCK分析Bulk CRISPR Screen数据

作者头像
生信菜鸟团
发布2023-08-23 09:18:22
3.6K0
发布2023-08-23 09:18:22
举报
文章被收录于专栏:生信菜鸟团

1- 前言 工具介绍

CRISPR 不需要多说

关于MAGeCK(取自Chat GPT3.5)

MAGeCK (Model-based Analysis of Genome-wide CRISPR-Cas9 Knockout): MAGeCK是一个用于分析CRISPR-Cas9基因敲除筛选数据的计算工具。它能够从大规模CRISPR筛选实验的测序数据中,鉴定出在细胞生存或增殖中起关键作用的基因。

补充:是刘小乐(Xiaole Shirley Liu)教授课题组开发的。

2- MAGeCK 学习资料

用到的资料:

官方的示例数据和代码

https://sourceforge.net/p/mageck/wiki/Home/

以下公众号文章

《CRISPR文库筛选分析1 MAGeck 学习笔记 (qq.com)》

3- MAGeCK的安装

代码语言:javascript
复制
conda create -c bioconda -n mageckenv mageck  # 环境中python版本要大于3
source activate mageckenv
conda update mageck
source deactivate

4- 学习MAGeCK手册

从官方说明看分析一共5个步骤

1- 下载数据

2- 准备library文件

3- 确定接头长度(选做)

4- 运行mageck count

5- 运行mageck test

4.1 Step1 准备数据

推荐大家使用kingfisher下载,参考推文

《小鼠的5个样品的10x技术单细胞转录组上游定量(文末赠送全套代码) (qq.com)》

示例数据下载&解压

代码语言:javascript
复制
kingfisher get -r ERR376998 ERR376999 -m ena-ascp ena-ftp prefetch aws-http
gunzip ERR376998.fastq.gz
gunzip ERR376999.fastq.gz

4.2 Step2 准备library文件

目的:library文件让MAGeCK 知道哪个 sgRNA 靶向哪个

基因文库地址:

MAGeCK - Browse /libraries at SourceForge.net

https://sourceforge.net/projects/mageck/files/libraries/

下载这个

格式:

4.3 Step3 准备接头长度参数

选做的理由:自0.5.6版本以来,MAGeCK 现在能够自动确定修剪长度和 sgRNA 长度,在大多数情况下。因此,您不需要执行此步骤,除非 MAGeCK 本身无法执行此步骤。

出于步骤完整,展示一下作者示例 作者的示例

前23位重复,去掉接头

如何去掉?

在mageck count中设置(--trim-5 23)参数,

看接下来的代码

4.4 Step4 mageck count的使用

目的:输出library文件中包含的基因的表达量。

准备好3个条件,我们就开始使用mageck count函数

注意:library文件和原始数据要在一个文件夹里面

代码语言:javascript
复制
mageck count -l yusa_library.csv -n escneg --sample-label "plasmid,ESC1" --trim-5 23 --fastq ERR376998.fastq  ERR376999.fastq

代码参数说明:

代码语言:javascript
复制
#  'mageck count' 命令名称 
#  '-l yusa_library.csv'  Step2 准备的library文件名
#  '-n escneg'输出结果文件名,输出文件名为escneg.count.txt
#  '--sample-label "plasmid,ESC1"',告诉mageck你的实验分组与样本号一一对应
#  '--trim-5 23' Step3 设置去接头(可选)
#  '--fastq ERR376998.fastq  ERR376999.fastq' Step1下载&解压的原始数据

escneg.count.txt(结果文件)展示:

代码语言:javascript
复制
sgRNA   Gene    plasmid ESC1
chr19:5884430-5884453   SLC25A45        13      32
chr11:58831475-58831498 OLFR312 94      108
chr4:49282352-49282375  E130309F12RIK   85      128

4.5 Step5 mageck test的使用

目的:比较实验组与对照组,看基因的正表达和负表达

代码如下:

代码语言:javascript
复制
mageck test -k escneg.count.txt -t ESC1 -c plasmid -n esccp

代码参数说明:

代码语言:javascript
复制
#  'mageck test' 命令名称 
#  '-k escneg.count.txt'  mageck count的结果
#  '-t ESC1',告诉mageck你的实验组是谁,名称与escneg.count.txt列名对应
#  '-c plasmid',告诉mageck你的对照组是谁,名称与escneg.count.txt列名对应
#  '-n esccp' 设置输出文件名为'esccp.gene_summary.txt'

输出结果

代码语言:javascript
复制
id      num     neg|score  neg|p-value   neg|fdr neg|rank        neg|goodsgrna   pos|score  pos|p-value   pos|fdr pos|rank  pos|goodsgrna
GTF2B   5       2.0462e-10      2.5851e-07      0.000707        1       5       1.0     1.0     1.0     19150   0
RPS5    5       5.9353e-10      2.5851e-07      0.000707        2       5       1.0     1.0     1.0     19149   0
RPL19   4       2.695e-09       2.5851e-07      0.000707        3       4       1.0     1.0     1.0     19148   0
KIF18B  5       1.0136e-08      2.5851e-07      0.000707        4       5       1.0     1.0     1.0     19146   0

5- 补充,MAGeCK实操分享

这样基本的代码说明完了,

在实操中有个点想分享给大家

library文件不一定要用MAGeCK的官方文件

叠个甲:刚接触,有什么不对劲的地方欢迎和谐交流。

MAGeCK提供的library如下

Addgene提供的library文件经过编辑也可以使用,拓充了我们library的库~

链接:

Addgene: Broad GPP - Mouse Genome-wide CRISPR knockout pooled libraries

https://www.addgene.org/pooled-library/broadgpp-mouse-knockout-brie/

下载library

读到R里面看一下,选择自己需要的列

代码语言:javascript
复制
rm(list = ls())
library(dplyr)
f=read.delim('broadgpp-brie-library-contents.txt')

取需要的列,改名

代码语言:javascript
复制
convert=f[,c("Position.of.Base.After.Cut..1.based.","sgRNA.Target.Sequence","Target.Gene.Symbol")]
colnames(convert)=c("Gene_ID","sgRNA_sequence","sgRNA_Target_gene")

结果:

为保持与参考library格式一致,修改第一列名字

代码语言:javascript
复制
convert$Gene_ID=paste0("s_",convert$Gene_ID)

library文件:

后续经过mageck count和mageck test

获得如下图基因上下调的数据

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 2- MAGeCK 学习资料
  • 3- MAGeCK的安装
  • 4- 学习MAGeCK手册
    • 4.1 Step1 准备数据
      • 4.2 Step2 准备library文件
        • 4.3 Step3 准备接头长度参数
          • 4.4 Step4 mageck count的使用
            • 4.5 Step5 mageck test的使用
            • 5- 补充,MAGeCK实操分享
              • library文件不一定要用MAGeCK的官方文件
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档