前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >lncRNA-seq数据分析之新lncRNA鉴定和注释视频课程众筹

lncRNA-seq数据分析之新lncRNA鉴定和注释视频课程众筹

作者头像
生信技能树
发布2020-03-17 16:16:02
1.9K0
发布2020-03-17 16:16:02
举报
文章被收录于专栏:生信技能树

前面我系统性的总结了:lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 ,还有LncRNA-seq的一般分析流程 ,里面提到了一个目前非常小众的分析方向,就是新lncRNA鉴定和注释,因为大部分人研究的物种的human或者mouse,已经被分析的很透彻了,encode计划等资源非常丰富,很少需要鉴定新的lncRNA。

不过对于其它物种,猫狗猪,甚至其它你叫不出来名字的昆虫,鱼类,这个分析策略还是蛮常见的。比如发表在Front. Genet., 18 March 2019 | https://doi.org/10.3389/fgene.2019.00196的文章

  • Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets

就是重新下载一个公共数据,然后进行新lncRNA鉴定和注释,分析部分主要是分成两个大块,首先是hisat2+stringtie流程,然后是组装好的gtf文件的后,细致的进行新lncRNA鉴定和注释。

LncRNA-seq数据分析的两个部分

分析流程如下:

新lncRNA鉴定和注释图解流程

前面的hisat2+stringtie流程流程很简单

就是参考:猪狗的参考基因组构建索引,还有使用ebi数据库直接下载fastq测序数据 ,做好准备工作,然后使用conda安装一些软件,建立好目录

代码语言:javascript
复制
conda create -n lncRNA
conda activate lncRNA
conda install -y -c  bioconda hisat2 stringtie samtools fastp   gffcompare
# conda search gffcompare
mkdir 0.qc 1.raw_fq 2.clean_fq 3.hisat2_bams 4.stringtie_gtfs 5.lncRNA

流程基本上3个软件,衔接一些即可

代码语言:javascript
复制
conda activate lncRNA
index=/home/jmzeng/reference/genome/pig/pig_hisat2
gtf=/home/jmzeng/reference/genome/pig/Sus_scrofa.Sscrofa11.1.99.chr.gtf

fastp -i 1.raw_fq/${id}_1.fastq.gz \
                    -o 2.clean_fq/${id}_1.fastp.fq.gz \
                    -I 1.raw_fq/${id}_2.fastq.gz \
                    -O 2.clean_fq/${id}_2.fastp.fq.gz \
                    -l 36 -q 20 --compression=6 \
                    -R ${id} -h ${id}.html
fq1=2.clean_fq/${id}_1.fastp.fq.gz
fq2=2.clean_fq/${id}_2.fastp.fq.gz
hisat2 -p 4 -x $index -1  $fq1 -2  $fq2 | \
samtools sort -@ 4  -o 3.hisat2_bams/$sample.bam -

stringtie -p 4 -G $gtf \
            -o 4.stringtie_gtfs/$sample.gtf  \
            -l  $sample 3.hisat2_bams/$sample.bam                 

当然,你需要自己去搜索理解软件的参数啦。

后面的新lncRNA鉴定和注释还是蛮耗费时间的

而且不同物种的新lncRNA鉴定和注释细节还不一样,不同的gtf文件版本可以对比印证。

我们研发的步骤是:

新lncRNA鉴定和注释的具体步骤

完整课程思维导图在:https://mubu.com/doc/ISk-Ev1tg

课程录制需要一些反馈和动力,所以采取众筹模式,吸纳部分真正有兴趣的朋友进入微信群参与讨论哈。(毕竟新lncRNA鉴定和注释是一个小众方向,大部分朋友就是看个热闹)

众筹模式

再次强调,你完全无需参与众筹,视频会完全免费共享在B站!!!

  • https://space.bilibili.com/338686099/#/

只不过是B站这个途径不方便共享这些学习素材,所以大家统一添加我们的加群小助手二维码然后进入微信群,我们录制视频过程会选择性跟大家互动,整理好资料后腾讯微云发送给群里的朋友!

(注意,不是答疑,不是售后,也不讲解Linux和R基础知识),你需要自己跟着我们生信技能树的系统性基础入门视频学习背景知识!

首先是LINUX学习

我在《生信分析人员如何系统入门Linux(2019更新版)》把Linux的学习过程分成6个阶段 ,提到过每个阶段都需要至少一天以上的学习:

  • 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
  • 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
  • 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不在神秘!
  • 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量
  • 第5阶段:任务提交及批处理,脚本编写解放你的双手
  • 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我
然后是R学习

我在在生信分析人员如何系统入门R(2019更新版) 里面给初学者的知识点路线图如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前面的hisat2+stringtie流程流程很简单
  • 后面的新lncRNA鉴定和注释还是蛮耗费时间的
  • 众筹模式
    • 首先是LINUX学习
      • 然后是R学习
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档