我正在尝试向SGE提交作业。它在过去一直以同样的方式对我起作用。现在,所有作业都停留在qw状态。
"qstat -g c“输出:
> CLUSTER QUEUE CQLOAD USED AVAIL TOTAL
> all.q 0.38 0 160 1920
> gpu6.q -NA- 0 0 4
> par6.q 0.38 750 135 1800
> seq6.q 0.41 103 170 416
> smp3.q 1.01 0 0 96
"qstat“输出看起来像往常一样。
Googling只给了我一些提示给那些有root访问权限的人,而我没有。有人建议吗?
谢谢。
编辑:作业是通过"qsub -q seq6.q scriptname“提交的,或者是smp3.q或par6.q。
据我所知,"qstat -j jobid“并没有什么特别之处:
job_number: 2821318
exec_file: job_scripts/2821318
submission_time: Wed Mar 4 12:07:15 2015
owner: username
uid: 31519
group: dch
gid: 1150
sge_o_home: /home/hudson/pg/username
sge_o_log_name: username
sge_o_path: /gpfs/hamilton6/apps/intel_comp_2014/composer_xe_2013_sp1.2.144/bin/intel64:/usr/local/bin:/bin:/usr/bin:/usr/lpp/mmfs/bin:/usr/local/Cluster-Apps/sge/6.1u6/bin/lx24-amd64:/panfs/panasas1.hpc.dur.ac.uk/apps/nag/fll6a21dpl/scripts
sge_o_shell: /bin/tcsh
sge_o_workdir: /panfs/panasas1.hpc.dur.ac.uk/username/path
sge_o_host: hamilton1
account: sge
mail_list: username@hamilton1
notify: FALSE
job_name: scriptname
jobshare: 0
hard_queue_list: seq6.q
env_list:
script_file: scriptname
scheduling info: (Collecting of scheduler job information is turned off)
发布于 2015-03-11 16:16:16
我今天也遇到了同样的问题。我们正在为客户运行Univa Grid Engine。我配置了一些complexes来运行需要主主机上大量内存的作业( h_stack=64M、memory_free=4G、virtual_free=4G)。在此之后,配置作业将在等待队列中挂起。这一配置与我们所有执行主机上的3G多年相匹配。我将在未来几天测试这个新的配置(4G)。所有服务器都有足够的内存!Ingo
https://stackoverflow.com/questions/28832762
复制相似问题