本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
PCS 中的 Slurm 会计 AWS
您可以在新 AWS PCS 集群上启用记账功能,以监控集群使用情况、强制执行资源限制以及管理对特定队列或计算节点组的精细访问控制。 AWS PCS 为您的集群创建和管理会计数据库,您无需创建和管理自己的独立会计数据库。 AWS PCS 使用 Slurm 中的记账功能。有关 Slurm 中记账功能的更多信息,请参阅 SchedMD 上的 Slurm 文档
要使用记账,请在创建新集群时将其启用,并可选择设置记账参数。在集群状态为Active并且具有计算节点组后,您可以连接到登录节点的 Linux 外壳以执行记账功能,例如使用 Slurm sacct 命令查看作业数据。
注意
Slurm 24.11 或更高版本支持记账。
重要
如果您启用会计,则会收取额外的账单费用。有关更多信息,请参阅 AWS PCS 定价页面
修改会计设置
无需重建基础架构,即可在现有集群上启用或禁用记账。有关更多信息,请参阅 在 AWS PCS 中更新集群。
禁用记账功能后,一旦集群进入UPDATING状态,记账功能的计费就会停止。启用记账功能后,从集群成功恢复到ACTIVE状态时开始计费。
PCS 中 Slurm 会计的关键概念 AWS
以下概念特定于 PCS,用于控制 AWS PCS 如何 AWS 实现 Slurm 记账。
会计数据库
AWS PCS 将您的会计数据存储在 AWS 拥有 AWS 账户 的数据库中。您无权访问 slurmdbd.conf.
默认清除时间
此 AWS PCS 设置指定所有会计记录类型(作业、事件、预留、步骤、暂停、交易、使用数据)的保留期(以天为单位)。例如,如果值为 30,则 AWS PCS 会将会计记录保留 30 天。您在创建集群时提供此值。如果您不提供值, AWS PCS 会无限期地在数据库中保留会计记录。
会计政策的执行
此设置决定了 Slurm 对您的集群执行任务提交规则、资源限制和会计策略的严格程度。此设置与集群slurm.conf文件中的AccountingStorageEnforce参数相对应。您可以选择执法选项的任意组合。如果您未选择任何选项,则不会对集群上的作业施加任何记账限制。 AWS PCS 支持以下选项:
-
关联- job-to-account 映射
-
限制-资源限制
-
QoS — 服务质量要求
-
安全模式 — 保证在限制范围内完成
-
nosteps — 禁用步骤记账
-
nojobs — 禁用工作记账
有关这些选项的更多信息,请参阅 SchedMD 上的 Slurm 文档。
获取现有 AWS PCS 集群的记账配置
Slurm 记账配置包含在您的集群的 Slurm 配置中。