

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 Studio 中設定 Slurm 叢集
<a name="sagemaker-hyperpod-studio-setup-slurm"></a>

下列指示描述如何在 Studio 中設定 HyperPod Slurm 叢集。

1. 建立網域或備妥網域。如需建立網域的詳細資訊，請參閱[使用 Amazon SageMaker AI 進行設定的指南](gs.md)。

1. (選用) 建立自訂 FSx for Lustre 磁碟區並將其連接至您的網域。

   1. 確保您的 FSx Lustre 檔案系統與預期網域存在於相同的 VPC 中，而且位於網域中存在的其中一個子網路中。

   1. 您可以遵循[將自訂檔案系統新增至網域](domain-custom-file-system.md)中的指示。

1. (選用) 建議您將標籤新增至叢集，以確保工作流程更順暢。如需如何新增標籤的相關資訊，請參閱 [編輯 SageMaker HyperPod 叢集](sagemaker-hyperpod-operate-slurm-console-ui.md#sagemaker-hyperpod-operate-slurm-console-ui-edit-clusters) 以使用 SageMaker AI 主控台更新叢集。

   1. 將 FSx for Lustre 檔案系統標記到您的 Studio 網域。這將協助您在啟動 Studio 空間時識別檔案系統。若要這樣做，請將下列標籤新增至您的叢集，以使用 FSx 檔案系統 ID `fs-id` 來識別它。

      標籤金鑰 = “`hyperpod-cluster-filesystem`”、標籤值 = “`fs-id`”。

   1. 將 [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html) 工作區標記到您的 Studio 網域。這將用來直接從 Studio 中的叢集快速連結至 Grafana 工作區。若要這樣做，請將下列標籤新增至您的叢集，以使用 Grafana 工作區 ID `ws-id` 來識別它。

      標籤金鑰 = “`grafana-workspace`”、標籤值 = “`ws-id`”。

1. 將以下許可新增到您的執行角色。

   如需 SageMaker AI 執行角色以及如何編輯這些角色的相關資訊，請參閱 [了解網域空間許可和執行角色](execution-roles-and-spaces.md)。

   若要了解如何將政策附加至 IAM 使用者或群組，請參閱[新增和移除 IAM 身分許可](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html)。

------
#### [ JSON ]

****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Effect": "Allow",
               "Action": [
                   "ssm:StartSession",
                   "ssm:TerminateSession"
               ],
               "Resource": "*"
           },
           {
               "Effect": "Allow",
               "Action": [
                   "sagemaker:CreateCluster",
                   "sagemaker:ListClusters"
               ],
               "Resource": "*"
           },
           {
               "Effect": "Allow",
               "Action": [
                   "cloudwatch:PutMetricData",
                   "cloudwatch:GetMetricData"
               ],
               "Resource": "*"
           },
           {
               "Effect": "Allow",
               "Action": [
                   "sagemaker:DescribeCluster",
                   "sagemaker:DescribeClusterNode",
                   "sagemaker:ListClusterNodes",
                   "sagemaker:UpdateCluster",
                   "sagemaker:UpdateClusterSoftware"
               ],
               "Resource": "arn:aws:sagemaker:{{us-east-1}}:{{111122223333}}:cluster/*"
           }
       ]
   }
   ```

------

1. 將標籤新增至此 IAM 角色，其中包含標籤金鑰 = “`SSMSessionRunAs`” 和標籤值 = “`os user`”。這裡的 `os user` 是您為 Slurm 叢集設定的相同使用者。使用 [AWS Systems Manager 代理程式 (SSM 代理程式)](https://docs.aws.amazon.com/systems-manager/latest/userguide/ssm-agent.html) 中的執行身分功能，在 IAM 角色或使用者層級管理對 SageMaker HyperPod 叢集的存取。搭配此功能，您可以使用與 IAM 角色或使用者相關聯的作業系統 (OS) 使用者來啟動每個 SSM 工作階段。

   如需如何將標籤新增至執行角色的相關資訊，請參閱[標記 IAM 角色](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_tags_roles.html)。

1. [為 Linux 和 macOS 受管節點開啟執行身分支援](https://docs.aws.amazon.com/systems-manager/latest/userguide/session-preferences-run-as.html) 執行身分設定是整個帳戶的，且需要此設定，所有 SSM 工作階段才能成功啟動。

1. (選用) [限制 Studio for Slurm 叢集的任務檢視](#sagemaker-hyperpod-studio-setup-slurm-restrict-tasks-view)。如需 Studio 中可檢視任務的相關資訊，請參閱 [任務​](sagemaker-hyperpod-studio-tabs.md#sagemaker-hyperpod-studio-tabs-tasks)。

在 Amazon SageMaker Studio 中，您可以導覽以在 HyperPod 叢集中檢視您的叢集 (在運算下)。

## 限制 Studio for Slurm 叢集的任務檢視
<a name="sagemaker-hyperpod-studio-setup-slurm-restrict-tasks-view"></a>

您可以限制使用者只檢視獲授權檢視的 Slurm 任務，而無需手動輸入命名空間或其他許可檢查。此限制會根據使用者的 IAM 角色套用，提供簡化且安全的使用者體驗。下節提供如何在 Studio for Slurm 叢集中限制任務檢視的相關資訊。如需 Studio 中可檢視任務的相關資訊，請參閱 [任務​](sagemaker-hyperpod-studio-tabs.md#sagemaker-hyperpod-studio-tabs-tasks)。

根據預設，所有 Studio 使用者都可以檢視、管理所有 Slurm 叢集任務，並與其互動。若要對此有所限制，您可以使用 [AWS Systems Manager 代理程式 (SSM 代理程式)](https://docs.aws.amazon.com/systems-manager/latest/userguide/ssm-agent.html) 中的**執行身分**功能，在 IAM 角色或使用者層級管理對 SageMaker HyperPod 叢集的存取。

您可以透過使用特定識別碼標記 IAM 角色來執行此操作，例如其使用者名稱或群組。當使用者存取 Studio 時，工作階段管理員會使用執行身分功能，以符合其 IAM 角色標籤的特定 Slurm 使用者帳戶執行命令。您可以設定 Slurm 組態，以根據使用者帳戶限制任務可見性。透過執行身分功能執行命令時，Studio UI 會自動篩選該特定使用者帳戶可見的任務。一旦設定，其擔任角色若有指定識別碼的每個使用者都會根據 Slurm 組態篩選這些 Slurm 任務。如需如何將標籤新增至執行角色的相關資訊，請參閱[標記 IAM 角色](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_tags_roles.html)。