有幸在工作中体验了几个计算集群的使用,几乎每个计算集群都有专门的集群调度系统,而当需要在短时间对多个系统做测试是第一道障碍就是熟悉各个调度系统的操作指令,以下列举近期使用到的几个分布式作业调度系统的常用操作指令和几个超算中心使用体验...,常用参数有-j 指定jobid,-u 指定用户, -p 指定队列, -w 指定计算节点进行查看任务信息
yhrun(srun): 交互式作业提交
常用命令 yhrun -N 1 -n 1 -c...pp100 -S 03/01/17 -E 03/31/17 --field=jobid,partition,jobname,user,nnodes,start,end,elapsed,state
国家超算无锡中心神威...-太湖之光
国家超算无锡中心神威-太湖之光包括商用x86平台和国产平台,国产平台采用申威26010处理器,有专用编译器,尚不支持JAVA, python, R等语言,x86平台普通节点配备两颗 Intel...bqueues: 查看可用队列信息
bhosts: 查看计算节点使用情况
bsub: 提交作业
简单任务参数,bsub -q queue -J name -n 36 -R span[hosts=1]