前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用RNA-seq定量软件salmon运行index步骤遇到的一个问题(计算集群slurm)

使用RNA-seq定量软件salmon运行index步骤遇到的一个问题(计算集群slurm)

作者头像
用户7010445
发布2023-01-06 20:36:14
5240
发布2023-01-06 20:36:14
举报

salmon 帮助文档

https://salmon.readthedocs.io/en/latest/building.html#installation

github主页

https://github.com/COMBINE-lab/salmon

我最开始是直接使用conda安装的 v1.4

首先第一步是对参考转录组进行索引,命令

代码语言:javascript
复制
salmon index -t pome.fa -i transcripts_index_1 -p 16

这一步不知道为啥总是卡住

image.png

到这里就进行不下去了

然后我在github上直接下载了编译好的v1.9

代码语言:javascript
复制
./salmon/bin/salmon index -t pome.fa -i transcripts_index_2

image.png

同样的会卡到这一步

但是用v1.0指定核心数却可以运行完

试了一次能够运行,试第二次的时候又卡住了 不知道为啥

这个和salmon是哪个版本关系应该不到,而且有时候可以成功,有时候就会卡住,但是卡住的时候多

已解决

请教了课题组的师兄,应该是文件存贮的原因,我用到的是计算机集群,涉及到的文件存储知识我也搞不太明白,我的大体理解是:计算集群存储的系统是两套,当启用一个计算节点的时候,这个计算节点有一个临时的文件存储系统,节点关闭自动会删除这个临时的文件存储系统,每次节点启动这个临时的存储系统路径都不一样,可以使用命令$TMPDIR来获取存储路径 参考这个链接 https://help.cropdiversity.ac.uk/data-storage.html。计算集群还有一个单独的文件存储系统,这个系统是永久的。默认的输出文件是在计算集群的单独的数据文件存储。使用salmon这个软件需要将输出文件指定到节点的临时文件存储中,运行完再将输出结果复制到计算集群的文件存储系统中

(这个理解不知道是否正确)

我运行如下命令

代码语言:javascript
复制
salmon index -t pome01.fa -i /tmp/myan_3797261/transcripts_index_05 --threads 4

就能够顺利运行,然后将结果复制到集群的存储系统中

代码语言:javascript
复制
cp -R $TMPDIR/transcripts_index_05/ ./

量化的步骤使用集群的文件存储还是节点的临时存储都是可以的

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-11-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 已解决
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档