slurm 分配资源的 2 种方式

小于 1 分钟

slurm 分配资源的 2 种方式

  1. 简单方式, 不需要安装 slurmdbd, 数据库; 以队列和用户组来分配
  2. 复杂方式, 需要安装 slurmdbd, 数据库; 通过 qos 来分配资源, 可以细分到 cpu 核

slurm 通过 AllowGroups 分配节点资源

  1. all 队列只允许 test01,test02 提交; big 队列只允许 test01, user01 提交

    修改配置文件, vim /etc/slurm/slurm.conf, 参照官网open in new window添加类似如下内容:

    PartitionName=all Nodes=c[01-10] MaxTime=INFINITE State=UP AllowGroups=test01,test02
    PartitionName=big Nodes=c[01-03] MaxTime=INFINITE State=UP AllowGroups=test01,user01
    

slurm 通过 qos 分配资源

  1. 加账号

    对每一个新加的用户执行下面的2条命令

    sacctmgr -i add account user1
    sacctmgr -i add user user1 account=user1
    
  2. 创建 qos

    # 限制每个用户最多使用64核, 提交超过限制则报错, 最长运行时间为30天
    sacctmgr add qos qos01 MaxTRESPerUser=cpu=64 Flags=DenyOnLimit MaxWall=30-00:00:00
    
  3. 分配 qos

    sacctmgr modify user set qos=qos01 where user=user1
    
  4. 查询用户对应的 qos

    sacctmgr show user user1 withassoc where account=user1
    
上次编辑于:
贡献者: jiyunqq