学习
实践
活动
工具
TVP
写文章
专栏首页生信技能树服务器集群任务调度系统大比拼!

服务器集群任务调度系统大比拼!

有幸在工作中体验了几个计算集群的使用,几乎每个计算集群都有专门的集群调度系统,而当需要在短时间对多个系统做测试是第一道障碍就是熟悉各个调度系统的操作指令,以下列举近期使用到的几个分布式作业调度系统的常用操作指令和几个超算中心使用体验

广州超算天河二号

普通刀片节点配备 两颗 Intel(R) Xeon(R) CPU E5-2692 v2 @ 2.20GHz 共24物理核,内存为64G 调度系统为 Slurm, 以下为常用指令

  • yhi(sinfo): 显示系统资源使用情况 yhi命令可查看当前账号可用队列的状态信息,主要用于查看队列中空闲节点情况,常用命令还有yhi -n cn12345查看指定节点信息, yhi -p paratera 查看指定队列信息
  • yhq(squeue): 显示作业状态 yhq可查看已投递任务的简要信息,包括任务状态、所在计算节点等信息,常用参数有-j 指定jobid,-u 指定用户, -p 指定队列, -w 指定计算节点进行查看任务信息
  • yhrun(srun): 交互式作业提交 常用命令 yhrun -N 1 -n 1 -c 24 -p paratera job.sh,由于天河服务器采用任务独占节点形式,所以每节点的任务最好设置为24
  • yhbatch(sbatch): 批处理作业提交 后台提交任务,功能与yhrun相同,命令yhbatch -N 1 -n 1 -c 24 job.sh
  • yhcancel(scancel): 取消已提交的作业 命令用法yhcancel JOBID
  • yhacct(sacct) 查看历史作业信息 yhacct -u pp100 -S 03/01/17 -E 03/31/17 --field=jobid,partition,jobname,user,nnodes,start,end,elapsed,state

国家超算无锡中心神威-太湖之光

国家超算无锡中心神威-太湖之光包括商用x86平台和国产平台,国产平台采用申威26010处理器,有专用编译器,尚不支持JAVA, python, R等语言,x86平台普通节点配备两颗 Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz CPU,共24物理核,内存为128G 调度系统不明,可能是自研的, 以下为常用指令

  • qload -w: 显示可用队列资源使用情况
  • bsub: 提交作业 常用参数 bsub -q q_x86_share -N 1 -o job.out /path/job.sh, 注意投递任务脚本路径必须填写绝对路径
  • bjobs: 显示作业状态
  • bkill JOBID: 取消已提交的作业

福建省超算中心曙光集群

福建省超算中心曙光集群普通计算节点配备 2颗 Intel(R) Xeon(R) Gold 6132 CPU @ 2.60GHz 共28物理核,内存为188G,在体验期间曾遇到频繁开启关闭超线程现象,同时也有幸在同系统内对开启或关闭超线程做了点小测试,测试结果显示开启超线程对计算密集型进行有小幅加速效果,但在以核时计费的系统中需要注意,开启超线程将会导致耗费核时为实际情况的两倍,此集群只有一个登录节点,节点运行程序较多,有mysql运行在登录节点,从一定程度上反映出集群管理不是很专业 调度系统为PBS, 以下为常用指令

  • pestat: 查看计算节点使用情况
  • qsub job.pbs: 提交作业 job.pbs中填写提交参数与执行程序,参数格式为 #PBS -q queue
  • qstat: 查看已提交作业 可通过-u 参数指定用户名进行只查看自己的任务
  • qdel JOBID: 取消已投递作业

某高校计算集群

普通计算节点配备两颗Intel(R) Xeon(R) Gold 6150 CPU @ 2.70GHz CPU,36物理核,内存188G,是体验中单节点性能最好的集群 调度系统为 LSF, 以下为常用指令

  • bqueues: 查看可用队列信息
  • bhosts: 查看计算节点使用情况
  • bsub: 提交作业 简单任务参数,bsub -q queue -J name -n 36 -R span[hosts=1] -o name.out -e name.err /path/job.sh
  • bjobs: 查看已提交作业
  • bkill JOBID: 取消已提交作业

自建计算集群

调度系统为 SGE, 以下为常用指令

  • qconf -sql: 显示队列 qconf -sq QUEUE: 显示指定队列信息
  • qhost: 查看计算节点使用情况
  • qsub: 提交作业
  • qstat:查看已提交作业
  • qdel JOBID: 取消已提交作业

分布式管理系统常用指令速查表

欢迎您继续补充完善

那我就补充一下,早在 2015年9月29日 我就介绍过关于qsub和condor两种在集群上面提交任务的方式比对

  • condor_q 可以用来查看任务提交情况
  • condor_rm 可以用来杀掉提交的任务。
文章分享自微信公众号:
生信技能树

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

作者:dongye_3377
原始发表时间:2019-05-31
如有侵权,请联系 cloudcommunity@tencent.com 删除。
登录 后参与评论
0 条评论

相关文章

  • Firmament – 大规模集群任务调度

    随着分布式计算集群规模的不断扩张,任务调度系统的稳定性成为了整个集群稳定的关键因素。随着容器技术的快速兴起,基于容器的计算平台被大量应用,任务调度的规模及频率快...

    星哥玩云
  • react源码--任务调度系统

    react是一个通用型开源前端框架,在前端各(hua)种(li)优(hu)秀(shao)的前端界面构建库中尤为出名。对此本着让开发时甩锅bug的理由更有说服力,...

    玖柒的小窝
  • [大家的项目] RUST多任务调度系统

    可移植多任务调度中间件,用于嵌入式环境,与应用程序一起编译打包,参考FreeRTOS实现。

    MikeLoveRust
  • FreeRTOS 任务调度 系统节拍

    文章 < FreeRTOS 任务调度 任务切换 > 记录了 FreeRTOS 中任务切换的过程, 提到触发任务切换的两种情况 : 高优先级任务就绪抢占和同优先...

    orientlu
  • 任务 or 实例 详解大数据 DAG 调度系统 Taier 任务调度

    ChunJun 开源项目地址:github 丨 gitee 喜欢我们的项目给我们点个__ STAR!STAR!!STAR!!!(重要的事情说三遍)__

    数栈DTinsight
  • Linux下定时任务(系统任务调度、用户任务调度)crontab使用详解

    版权声明:本文为耕耘实录原创文章,各大自媒体平台同步更新。欢迎转载,转载请注明出处,谢谢

    耕耘实录
  • Azkaban 任务调度系统(安装搭建)

    无论是在业务开发还是在大数据开发中,脚本都是必不可少的存在,在初期我们会使用crontab来解决问题,那么当发现规模变大监控需求可视化需求的到来Crontab已...

    喵了个咪233
  • springboot使用quartz实现定时任务_quartz集群任务调度

    springboot使用quartz实现定时任务_quartz集群任务调度前言本文是对之前的一篇文章Spring+SpringMVC+mybatis+Quart...

    Java架构师必看
  • 开源交流丨任务or实例 详解大数据DAG调度系统Taier任务调度

    ChunJun 开源项目地址:github 丨 gitee 喜欢我们的项目给我们点个__ STAR!STAR!!STAR!!!(重要的事情说三遍)__

    数栈DTinsight
  • 浅析集群调度系统的演进

    Kubernetes 已经成为容器编排领域的事实标准,将来所有应用都会在 Kubernetes 上开发和运行,这个系列文章的目的是深入浅出的介绍 Kubern...

    iMike
  • 利用Mesos构建多任务调度系统

    扫帚的影子
  • 详解BI系统中的任务调度

    任务调度是一个通用的计算机概念,可以简单地理解为计算机基于一定时间频率,自动执行一项进程任务。任务调度是操作系统的重要组成部分,Windows系统中的定时任务和...

    葡萄城控件
  • 【SmartOS】轻量级多任务调度系统

    SmartOS是一个完全由新生命团队设计的嵌入式操作系统,主要应用于智能家居、物联网、工业自动化控制等领域。 ARM Cortex-M系列微处理器几乎全都做成...

    大石头
  • Spring Boot Quartz 分布式集群任务调度实

    在工程中时常会遇到一些需求,例如定时刷新一下配置、隔一段时间检查下网络状态并发送邮件等诸如此类的定时任务。 定时任务本质就是一个异步的线程,线程可以查询或修改并...

    乱敲代码
  • Azkaban 任务调度系统(使用和小技巧)

    上节主要介绍了安装搭建和简单的运行一个job,但是真正使用到实际场景还是需要了解更多的知识,比如任务怎么互相依赖,可以选择指定的节点来执行吗等等一些相关的操作会...

    喵了个咪233
  • 任务调度系统建设迭代计划(二)

    关于任务调度的设计,完成了整体的设计和快速迭代的一个版本,我们需要考虑分布式的方案。

    jeanron100
  • 任务调度系统建设迭代计划(一)

    近期在对接任务调度系统的时候,对整体系统的设计有了一个较为全面的认识,而原本的任务接入是更偏重于数据库方向的任务,而在后续要接入通用任务,这部分的工作和原来相比...

    jeanron100
  • 如何实现一个任务调度系统

    写这篇文章,想和大家从头到脚说说任务调度,希望大家读完之后,能够理解实现一个任务调度系统的核心逻辑。

    勇哥java实战分享
  • 美团集群调度系统HULK技术演进

    值此佳节之际,美美为大家呈送一份技术干货作为中秋礼物。本文根据美团基础架构部/弹性策略团队负责人涂扬在2019 QCon(全球软件开发大会)上的演讲内容整理而成...

    CNCF

扫码关注腾讯云开发者

领取腾讯云代金券