前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >学习小组Day1-bubble

学习小组Day1-bubble

原创
作者头像
bubble
发布2023-10-30 23:27:36
2390
发布2023-10-30 23:27:36
举报
文章被收录于专栏:学习小组总结

markdown语法练习

rna流程及组装代码

1.在Linux中下载conda工具

1.1下载

代码语言:txt
复制
wget -c https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash  Miniconda3-latest-Linux-x86_64.sh

按y yes 回车等进行安装然后重新激活环境

代码语言:txt
复制
source .bashrc

1.2配置镜像

代码语言:txt
复制
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

因为第一步下载的conda是北外的源配置镜像也用的北外的镜像 最好统一

conda config --set show_channel_urls yes这一步是搜索时显示通道地址

配置完成会默认进入base环境每一次都是 但是在数据分析过程中我们需要将每次下载的软件数据等创建新的小环境(最好是每做新的项目就创新的小环境不要在base中进行分析具体为什么是因为大家好像都这样做而且看的b站教程也是这么说具体没看)

https://www.bilibili.com/video/BV1Yy4y117SX/?spm_id_from=333.999.0.0&vd_source=6c8ab645f6b1e003ee51c6139251c835 详见网址(b站教程)

因此可以用这串代码解决

代码语言:txt
复制
conda config --set auto_activate_base false

https://blog.csdn.net/weixin_44159487/article/details/105620256 代码来源

1.3创建环境

代码语言:txt
复制
conda create -n xxx
# xxx可以是所创建环境名eg:rna
输入y 回车
# 激活环境
conda activate rna
# 成功进入rna环境之中啦
# 退出环境
conda deactivate

2.下载软件

代码语言:txt
复制
# trinity也可以是别的只要是软件名即可 eg:sratoolskit 用于下载数据 这里我sratools 是官网用迅雷下载利用xftp上传就不写了
conda install -c bioconda trinity 

下载好输入y 回车安装等等

3.下载数据

安装好sratoolskit就可以进行下载了

代码语言:txt
复制
prefetch SRRxxxxxx

在NCBI中找自己数据SRR号即可进行下载

2.将下载好数据进行解压

代码语言:txt
复制
1.fastq-dump --split-e --gzip ./SRRxxxxxx/SRRxxxxxx.sra # 将sra数据放在文件中的解压
2.fastq-dump --split-e SRRxxxxxx.sra # 在当前sra文件中的解压
# 两种方式只有路径区别自己看好文件路径即可

但是以上的代码是我网上找的是可以解压但是之后使用trinity一直在报错

可以看到error原因说找不到它提供了一串代码说让我这样解压

代码语言:txt
复制
fastq-dump-defline-seq@$sn[_$rn]/$ri'--split-files file.sra

于是我重新解压数据(数据为双端测序 paired)

代码语言:txt
复制
fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-files --gzip ./SRRxxxxxx/SRRxxxxx.sra
# 会有两个文件输出SRRxxxxxx_1.fastq.gz SRRxxxxxx_2.fastq.gz
# 终于能正常运行了T_T

--gzip就是解压后数据是压缩形式 之后软件都可识别且节省空间

4.解压完过滤

使用的是trinity conda下载的软件包中的 trimmomatic软件

去接头

代码语言:txt
复制
nohup java -jar /下载的软件路径/trimmomatic.jar PE -threads 6 -phred33 -trimlog test.log SRRxxxxxx_1.fastq.gz SRRxxxxxx_2.fastq.gz SRRxxxxxx_1_1.fastq.gz SRRxxxxxx_1_2.fastq.gz SRRxxxxxx_2_1.fastq.gz SRRxxxxxx_2_2.fastq.gz HEADCROP:15 &
# 输出四个文件  SRRxxxxxx_1_1.fastq.gz SRRxxxxxx_1_2.fastq.gz SRRxxxxxx_2_1.fastq.gz SRRxxxxxx_2_2.fastq.gz
# SRRxxxxxx_1.fasta .gz SRRxxxxxx_2.fasta .gz 是输入文件
# SRRxxxxxx_1_1.fastq.gz .和SRRxxxxxx_2_1.fastq.gz .过滤之后的rna
# SRRxxxxxx_1_1.gz .和SRRxxxxxx_2_1.gz .过滤之后不要的
#其中 SRRxxxxxx_1_1.fastq.gz  SRRxxxxxx_2_1.fastq.gz是之后需要用到的

nohup <命令> & 将运行进程挂后台可以不用一直开着电脑和终端退出也可以了

-threads 6 线程数6

HEADCROP:15 接头15个碱基去掉

其他trinity用法参数等参考

https://zhuanlan.zhihu.com/p/99929230

5.组装!

代码语言:txt
复制
nohup Trinity --seqType fq --max_memory 50G --left SRRxxxxxx_1_1.fastq.gz  --right SRRxxxxxx_2_1.fastq.gz  --CPU 6 --output SRRxxxxxx-Trinity &
#  --seqType fq必要参数
#  --max_memory 50G最大运存
#  --CPU 6线程数
#  --output SRRxxxxxx-Trinity 输出文件名

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • markdown语法练习
    • rna流程及组装代码
      • 1.在Linux中下载conda工具
        • 1.1下载
          • 1.2配置镜像
            • 1.3创建环境
              • 2.下载软件
                • 3.下载数据
                  • 2.将下载好数据进行解压
                    • 4.解压完过滤
                      • 5.组装!
                      领券
                      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档