翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ダッシュボードの設定
Amazon SageMaker HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンを設定するには、以下の情報を使用します。これにより、EKS クラスターのハードウェア、チームの割り当て、タスクのメトリクスを表示する詳細なビジュアルダッシュボードを設定できます。
設定で問題が発生した場合は、「トラブルシューティング」で既知の解決策を参照してください。
HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンの前提条件
次のセクションでは、Amazon EKS オブザーバビリティアドオンをインストールする前に必要な前提条件について説明します。
-
クラスター管理者の IAM ユーザーに、HyperPod クラスター管理者向けの最小権限ポリシーが設定されていることを確認します。
-
CloudWatchAgentServerPolicy IAM ポリシーをワーカーノードにアタッチします。これを行うには、次のコマンドを入力します。my-worker-node-role は、Kubernetes ワーカーノードで使用する IAM ロールに置き換えます。
aws iam attach-role-policy \
--role-name my-worker-node-role \
--policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy
HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンの設定
Amazon SageMaker HyperPod Amazon CloudWatch オブザーバビリティ EKS アドオンを設定するには、以下のオプションを使用します。
- Setup using the SageMaker AI console
-
HyperPod タスクガバナンスダッシュボードを設定して可視化するには、次のアクセス許可が必要です。このセクションでは、「クラスター管理者の IAM ユーザー」に記載されているアクセス許可について詳しく説明します。
タスクガバナンスを管理するには、以下のサンプルポリシーを使用します。
JSON
- JSON
-
{
"Version":"2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"sagemaker:ListClusters",
"sagemaker:DescribeCluster",
"sagemaker:ListComputeQuotas",
"sagemaker:CreateComputeQuota",
"sagemaker:UpdateComputeQuota",
"sagemaker:DescribeComputeQuota",
"sagemaker:DeleteComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"sagemaker:CreateClusterSchedulerConfig",
"sagemaker:UpdateClusterSchedulerConfig",
"sagemaker:DeleteClusterSchedulerConfig",
"eks:ListAddons",
"eks:CreateAddon",
"eks:DescribeAddon",
"eks:DescribeCluster",
"eks:DescribeAccessEntry",
"eks:ListAssociatedAccessPolicies",
"eks:AssociateAccessPolicy",
"eks:DisassociateAccessPolicy"
],
"Resource": "*"
}
]
}
Amazon CloudWatch オブザーバビリティ Amazon EKS を管理し、SageMaker AI コンソールから HyperPod クラスターダッシュボードを表示するアクセス許可を付与するには、以下のサンプルポリシーを使用します。
JSON
- JSON
-
{
"Version":"2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"eks:ListAddons",
"eks:CreateAddon",
"eks:UpdateAddon",
"eks:DescribeAddon",
"eks:DescribeAddonVersions",
"sagemaker:DescribeCluster",
"sagemaker:DescribeClusterNode",
"sagemaker:ListClusterNodes",
"sagemaker:ListClusters",
"sagemaker:ListComputeQuotas",
"sagemaker:DescribeComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"eks:DescribeCluster",
"cloudwatch:GetMetricData",
"eks:AccessKubernetesApi"
],
"Resource": "*"
}
]
}
SageMaker HyperPod コンソールの [ダッシュボード] タブに移動して、Amazon CloudWatch オブザーバビリティ EKS をインストールします。タスクガバナンス関連のメトリクスが [ダッシュボード] に含まれていることを確認するには、Kueue メトリクスチェックボックスを有効にします。Kueue メトリクスを有効にすると、無料利用枠の制限に達した後、CloudWatch メトリクス のコストが有効になります。詳細については、「Amazon CloudWatch 料金表」の「メトリクス」を参照してください。
- Setup using the EKSAWS CLI
-
アドオンをインストールするには、次の EKS AWS CLIコマンドを使用します。
aws eks create-addon --cluster-name cluster-name
--addon-name amazon-cloudwatch-observability
--configuration-values "configuration json"
以下は、設定値の JSON の例です。
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
}
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
- Setup using the EKS Console UI
-
-
[EKS コンソール] に移動します。
-
クラスターを選択します。
-
[アドオン] を選択します。
-
[Amazon CloudWatch オブザーバビリティ] アドオンを探して、インストールします。アドオンは、2.4.0 以降のバージョンをインストールします。
-
次の JSON 設定値を含めます。
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
},
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
EKS オブザーバビリティアドオンのインストールが正常に完了したら、HyperPod コンソールの [ダッシュボード] タブで EKS クラスターのメトリクスを表示できます。