slurm 分配资源的 2 种方式
小于 1 分钟
slurm 分配资源的 2 种方式
- 简单方式, 不需要安装 slurmdbd, 数据库; 以队列和用户组来分配
- 复杂方式, 需要安装 slurmdbd, 数据库; 通过 qos 来分配资源, 可以细分到 cpu 核
slurm 通过 AllowGroups 分配节点资源
all 队列只允许 test01,test02 提交; big 队列只允许 test01, user01 提交
修改配置文件,
vim /etc/slurm/slurm.conf
, 参照官网添加类似如下内容:PartitionName=all Nodes=c[01-10] MaxTime=INFINITE State=UP AllowGroups=test01,test02 PartitionName=big Nodes=c[01-03] MaxTime=INFINITE State=UP AllowGroups=test01,user01
slurm 通过 qos 分配资源
加账号
对每一个新加的用户执行下面的2条命令
sacctmgr -i add account user1 sacctmgr -i add user user1 account=user1
创建 qos
# 限制每个用户最多使用64核, 提交超过限制则报错, 最长运行时间为30天 sacctmgr add qos qos01 MaxTRESPerUser=cpu=64 Flags=DenyOnLimit MaxWall=30-00:00:00
分配 qos
sacctmgr modify user set qos=qos01 where user=user1
查询用户对应的 qos
sacctmgr show user user1 withassoc where account=user1