ダッシュボードの設定 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ダッシュボードの設定

Amazon SageMaker HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンを設定するには、以下の情報を使用します。これにより、EKS クラスターのハードウェア、チームの割り当て、タスクのメトリクスを表示する詳細なビジュアルダッシュボードを設定できます。

設定で問題が発生した場合は、「トラブルシューティング」で既知の解決策を参照してください。

HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンの前提条件

次のセクションでは、Amazon EKS オブザーバビリティアドオンをインストールする前に必要な前提条件について説明します。

  • クラスター管理者の IAM ユーザーに、HyperPod クラスター管理者向けの最小権限ポリシーが設定されていることを確認します。

  • CloudWatchAgentServerPolicy IAM ポリシーをワーカーノードにアタッチします。これを行うには、次のコマンドを入力します。my-worker-node-role は、Kubernetes ワーカーノードで使用する IAM ロールに置き換えます。

    aws iam attach-role-policy \ --role-name my-worker-node-role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy

HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンの設定

Amazon SageMaker HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンを設定するには、以下のオプションを使用します。

Setup using the SageMaker AI console

HyperPod タスクガバナンスダッシュボードを設定して可視化するには、次のアクセス許可が必要です。このセクションでは、「クラスター管理者の IAM ユーザー」に記載されているアクセス許可について詳しく説明します。

タスクガバナンスを管理するには、以下のサンプルポリシーを使用します。

JSON
JSON
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:ListClusters", "sagemaker:DescribeCluster", "sagemaker:ListComputeQuotas", "sagemaker:CreateComputeQuota", "sagemaker:UpdateComputeQuota", "sagemaker:DescribeComputeQuota", "sagemaker:DeleteComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "sagemaker:CreateClusterSchedulerConfig", "sagemaker:UpdateClusterSchedulerConfig", "sagemaker:DeleteClusterSchedulerConfig", "eks:ListAddons", "eks:CreateAddon", "eks:DescribeAddon", "eks:DescribeCluster", "eks:DescribeAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "*" } ] }

Amazon CloudWatch オブザーバビリティ Amazon EKS を管理し、SageMaker AI コンソールから HyperPod クラスターダッシュボードを表示するアクセス許可を付与するには、以下のサンプルポリシーを使用します。

JSON
JSON
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "eks:ListAddons", "eks:CreateAddon", "eks:UpdateAddon", "eks:DescribeAddon", "eks:DescribeAddonVersions", "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:ListClusters", "sagemaker:ListComputeQuotas", "sagemaker:DescribeComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "eks:DescribeCluster", "cloudwatch:GetMetricData", "eks:AccessKubernetesApi" ], "Resource": "*" } ] }

SageMaker HyperPod コンソールの [ダッシュボード] タブに移動して、Amazon CloudWatch オブザーバビリティ EKS をインストールします。タスクガバナンス関連のメトリクスが [ダッシュボード] に含まれていることを確認するには、Kueue メトリクスチェックボックスを有効にします。Kueue メトリクスを有効にすると、無料利用枠の制限に達した後、CloudWatch メトリクス のコストが有効になります。詳細については、「Amazon CloudWatch 料金表」の「メトリクス」を参照してください。

Setup using the EKSAWS CLI

アドオンをインストールするには、次の EKS AWS CLIコマンドを使用します。

aws eks create-addon --cluster-name cluster-name --addon-name amazon-cloudwatch-observability --configuration-values "configuration json"

以下は、設定値の JSON の例です。

{ "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } } }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }
Setup using the EKS Console UI
  1. [EKS コンソール] に移動します。

  2. クラスターを選択します。

  3. [アドオン] を選択します。

  4. [Amazon CloudWatch オブザーバビリティ] アドオンを探して、インストールします。アドオンは、2.4.0 以降のバージョンをインストールします。

  5. 次の JSON 設定値を含めます。

    { "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } }, }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }

EKS オブザーバビリティアドオンのインストールが正常に完了したら、HyperPod コンソールの [ダッシュボード] タブで EKS クラスターのメトリクスを表示できます。