我已经发现了我的服务器上的内存速度和延迟问题。我从OVH租用这台服务器,在更换RAM之前,他们的要求之一是
要启动干预,需要在票证中发送日志,显示标识符和受影响的RAM模块。
我如何能够检测到DRAM芯片的故障,因为这是一个大型(1TBRAM)生产服务器,几天不运行memtest86+。
sysbench -测试=内存-内存块大小=4G-内存总量=32G运行
WARNING: the --test option is deprecated. You can pass a script name or path on the command line without any options.
s
根据这里的答案,用户可以通过What does the --ntasks or -n tasks does in SLURM?的ntasks参数并行运行多个作业,后跟srun。要问一个后续问题-如何指定在以这种方式并行运行作业时所需的内存量? 如果3个作业并行运行,每个作业需要8G内存,是在sbatch中指定24G内存(即来自所有作业的内存总和)还是不在sbatch中给出内存参数,而是为每个srun指定8G内存