在 AWS PCS 中创建队列 - AWS PC

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 AWS PCS 中创建队列

本主题概述了可用选项,并介绍了在 AWS PCS 中创建队列时应考虑的事项。

注意

您可以在队列上配置自定义 Slurm 设置,以实现特定分区的调度策略和资源管理。有关更多信息,请参阅 在 PCS 中配置自定义 Slurm 设置 AWS

先决条件

  • AWS PCS 集群-队列只能与特定 AWS PCS 集群关联创建。

  • 一个或多 AWS 个 PCS 计算节点组-队列必须与至少一个 AWS PCS 计算节点组相关联。

在 AWS PCS 中创建队列

您可以使用 AWS Management Console 或创建队列 AWS CLI。

AWS Management Console
使用控制台创建队列
  1. 打开 AWS PCS 控制台

  2. 为队列选择集群。导航到 “队列”,然后选择 “创建队列”。

  3. 队列配置部分中,提供以下值:

    1. 队列名称-队列的名称。名称只能包含字母数字字符(区分大小写)和连字符。它必须以字母字符开头,长度不能超过 25 个字符。该名称在集群中必须是唯一的。

    2. 计算节点组-选择 1 个或多个计算节点组来为该队列提供服务。一个计算节点组可以与多个队列关联。

  4. (可选)在其他调度程序设置部分,您可以添加参数名称和值对来配置其他 Slurm 设置。有关支持的参数的完整列表,请参阅PCS 队列的自定义 Slurm 设置 AWS

  5. (可选)在 “标签” 下,将所有标签添加到您的 AWS PCS 队列中

  6. 选择创建队列。当 AWS PCS 创建队列时,状态字段将显示正在创建。创建队列可能需要几分钟。

建议采取下一步行动
  • 向您的新队列提交任务。

AWS CLI
使用创建队列 AWS CLI

使用以下命令创建队列。进行以下替换:

  1. region-code替换为集群的 AWS 区域。例如 us-east-1

  2. my-queue替换为队列的名称。名称只能包含字母数字字符(区分大小写)和连字符。它必须以字母字符开头,长度不能超过 25 个字符。该名称在集群中必须是唯一的。

  3. my-cluster替换为集群的名称或 ID。

  4. compute-node-group-id替换为为队列提供服务的计算节点组的 ID。例如 pcs_abcdef12345

    注意

    创建队列时,必须提供计算节点组的 ID,而不是其名称。

aws pcs create-queue --region region-code \ --queue-name my-queue \ --cluster-identifier my-cluster \ --compute-node-group-configurations \ computeNodeGroupId=compute-node-group-id
例 — 使用自定义 Slurm 设置创建队列
aws pcs create-queue --region region-code \ --queue-name my-queue \ --cluster-identifier my-cluster \ --compute-node-group-configurations \ computeNodeGroupId=compute-node-group-id \ --slurm-configuration \ 'slurmCustomSettings=[{parameterName=Default,parameterValue=YES}]'

有关更多信息,请参阅 PCS 队列的自定义 Slurm 设置 AWS

创建队列可能需要几分钟。您可以使用以下命令查询队列的状态。在队列状态达到之前,您将无法向队列提交作业ACTIVE

aws pcs get-queue --region region-code \ --cluster-identifier my-cluster \ --queue-identifier my-queue
建议采取下一步行动
  • 向新队列提交作业