SageMaker HyperPod オブザーバビリティアドオンの設定 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker HyperPod オブザーバビリティアドオンの設定

次のリストでは、オブザーバビリティアドオンを設定するための前提条件について説明します。

Amazon SageMaker HyperPod (SageMaker HyperPod) クラスターのメトリクスを Amazon Managed Service for Prometheus ワークスペースに送信し、オプションで Amazon Managed Grafana で表示するには、まず以下のマネージドポリシーとアクセス許可をコンソールロールにアタッチします。

  • Amazon Managed Grafana を使用するには、Amazon Managed Grafana AWS リージョンが利用可能な で AWS IAM アイデンティティセンター(IAM Identity Center) を有効にします。手順については、「AWS IAM アイデンティティセンター ユーザーガイド」の「IAM アイデンティティセンターの開始方法」を参照してください。Amazon Managed Grafana が利用可能な AWS リージョンのリストについては、「Amazon Managed Grafana ユーザーガイド」の「サポートされているリージョン」を参照してください。

  • IAM アイデンティティセンターで少なくとも 1 人のユーザーが作成済み。

  • Amazon EKS Pod Identity Agent アドオンが Amazon EKS クラスターにインストールされていることを確認します。Amazon EKS Pod Identity Agent アドオンを使用すると、SageMaker HyperPod オブザーバビリティアドオンが Amazon Managed Service for Prometheus および CloudWatch Logs とやり取りするための認証情報を取得できます。Amazon EKS クラスターにアドオンがあるかどうかを確認するには、Amazon EKS コンソールに移動し、クラスターの [アドオン] タブを確認します。アドオンがインストールされていない場合にインストールする方法については、「Amazon EKS ユーザーガイド」の「アドオンを作成する (AWS マネジメントコンソール)」を参照してください。

  • SageMaker HyperPod オブザーバビリティアドオンをインストールする前に、SageMaker HyperPod クラスターに少なくとも 1 つのノードがあることを確認します。この場合、最小の Amazon EC2 インスタンスタイプは 4xlarge です。この最小ノードサイズ要件により、ノードは SageMaker HyperPod オブザーバビリティアドオンが作成するすべてのポッドと、クラスターで既に実行されている他のポッドに対応できます。

  • ロールに次のポリシーとアクセス許可を追加します。

    • AWS マネージドポリシー: AmazonSageMakerHyperPodObservabilityAdminAccess

    • AWSマネージドポリシー: AWSGrafanaWorkspacePermissionManagementV2

    • AWSマネージドポリシー: AmazonSageMakerFullAccess

    • Amazon Managed Grafana および Amazon Elastic Kubernetes Service アドオンアクセスに必要な IAM ロールを設定するための追加のアクセス許可:

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] } ] }
    • Amazon Managed Grafana の IAM アイデンティティセンターユーザーを管理するために必要な追加のアクセス許可:

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }

上記の前提条件を満たしていることを確認したら、オブザーバビリティアドオンをインストールできます。

オブザーバビリティアドオンを迅速にインストールするには
  1. Amazon SageMaker AI コンソール (https://console.aws.amazon.com/sagemaker/) を開きます。

  2. クラスターの詳細ページに移動します。

  3. [ダッシュボード] タブで、[HyperPod モニタリングとオブザーバビリティ] という名前のアドオンを探して、[クイックインストール] をクリックします。

オブザーバビリティアドオンをカスタムインストールするには
  1. クラスターの詳細ページに移動します。

  2. [ダッシュボード] タブで、[HyperPod モニタリングとオブザーバビリティ] という名前のアドオンを探して、[カスタムインストール] をクリックします。

  3. 表示するメトリクスのカテゴリを指定します。メトリクスのカテゴリの詳細については、「SageMaker HyperPod クラスターのメトリクス」を参照してください。

  4. Amazon CloudWatch Logs を有効にするかどうかを指定します。

  5. サービスで新しい Amazon Managed Service for Prometheus ワークスペースを作成するかどうかを指定します。

  6. Amazon Managed Grafana ダッシュボードでメトリクスを表示するには、[Amazon マネージド Grafana ワークスペースを使用する] というラベルのチェックボックスをオンにします。独自のワークスペースを指定するか、サービスに新しいワークスペースを作成させることができます。

    注記

    Amazon Managed Grafana は、Amazon Managed Service for Prometheus が利用可能なすべての AWS リージョンで利用できるわけではありません。ただし、任意の AWS リージョンに Grafana ワークスペースを設定し、別の AWS リージョンにある Prometheus ワークスペースからメトリクスデータを取得するように設定できます。詳細については、「AWS データソース設定を使用して Amazon Managed Service for Prometheus をデータソースとして追加する」と「Amazon Managed Service for Prometheus およびオープンソースの Prometheus データソースに接続する」を参照してください。