PCS 中的 Slurm REST API AWS - AWS PC

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

PCS 中的 Slurm REST API AWS

AWS PCS 通过为 Slurm 的原生 REST API 提供托管支持slurmrestd,为编程集群交互提供一个 HTTP 接口。您可以通过标准 HTTP 请求提交作业、监控集群状态和管理资源,而无需直接 shell 访问您的集群。

常见使用案例

Slurm REST API 支持各种集成场景:

  • Web 应用程序集成:构建可直接提交和管理作业的自定义前端和 Web 应用程序。

  • Jupyter 笔记本集成:允许研究人员在不离开开发工作流程的情况下从笔记本环境中提交作业。

  • 合作伙伴解决方案集成:将第三方 HPC 工具和工作流程管理器连接到您的 AWS PCS 集群。

  • 编程集群管理:自动执行作业提交、监控和资源管理工作流程。

  • 研究计算工作流程:支持需要 API 驱动的作业管理的学术和企业研究环境。

要求和限制

在使用 Slurm REST API 之前,请查看以下详细信息:

  • 您的集群必须使用 Slurm 版本 25.05 或更高版本。

  • API 终端节点只能通过集群 VPC 内的私有 IP 地址进行访问。

  • 您的集群安全组必须允许端口 6820 上的 HTTP 流量。

  • 身份验证需要带有特定用户身份声明的 JWT 令牌。

目前的限制包括:

  • 不支持scontrol token生成的令牌。

  • X-SLURM-USER-NAME标题模拟不可用。

  • 某些功能需要启用 Slurm 记账。

  • 与 Slurm CLI 过滤器插件机制不兼容。

  • 与 REST API 端点的连接未使用 TLS 进行加密。