我希望收集作业数组中所有作业的效率报告。seff命令并没有真正的选项。当我对一个数组作业id运行seff命令时,我只得到了数组中一个作业的效率报告。
有没有人知道如何获得数组中所有作业的效率报告,或者如何收集累积统计信息,如内存的均值、最小值和最大值,以及作业数组中所有作业的CPU?
下面是我的输出:
[user@cluster]$ seff 26838
Job ID: 26838
Array Job ID: 26835_1
Cluster: cluster
User/Group: user/HPCusers
State: COMPLETED (exit code 0)
Cores: 1
CPU Utilized: 00:05:29
CPU Efficiency: 103.13% of 00:05:19 core-walltime
Job Wall-clock time: 00:05:19
Memory Utilized: 125.11 MB
Memory Efficiency: 8.94% of 1.37 GB
发布于 2020-06-02 07:56:56
来自seff
代码中的注释“大致相同”:
sacct -P -n -a --format JobID,User,Group,State,Cluster,AllocCPUS,REQMEM,TotalCPU,Elapsed,MaxRSS,ExitCode,NNodes,NTasks -j <job_id>
但是,与seff
不同的是,它输出作业中每一步的信息。我希望它还能输出作业数组中每个作业的信息……
https://stackoverflow.com/questions/58944487
复制相似问题