Pengaturan dasbor - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pengaturan dasbor

Gunakan informasi berikut untuk menyiapkan add-on Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS. Ini membuat Anda siap dengan dasbor visual terperinci yang menyediakan tampilan metrik untuk perangkat keras kluster EKS, alokasi tim, dan tugas Anda.

Jika Anda mengalami masalah saat menyiapkan, silakan lihat Pemecahan Masalah untuk solusi pemecahan masalah yang diketahui.

HyperPod Prasyarat add-on Amazon CloudWatch Observability EKS

Bagian berikut mencakup prasyarat yang diperlukan sebelum menginstal add-on Amazon EKS Observability.

  • Pastikan Anda memiliki kebijakan izin minimum untuk administrator HyperPod klaster, diPengguna IAM untuk admin cluster.

  • Lampirkan kebijakan CloudWatchAgentServerPolicy IAM ke node pekerja Anda. Untuk melakukan hal itu, masukkan perintah berikut. Ganti my-worker-node-role dengan peran IAM yang digunakan oleh node pekerja Kubernetes Anda.

    aws iam attach-role-policy \ --role-name my-worker-node-role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy

HyperPod Penyiapan add-on Amazon CloudWatch Observability EKS

Gunakan opsi berikut untuk menyiapkan add-on Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS.

Setup using the SageMaker AI console

Izin berikut diperlukan untuk penyiapan dan visualisasi dasbor tata kelola HyperPod tugas. Bagian ini memperluas izin yang tercantum di. Pengguna IAM untuk admin cluster

Untuk mengelola tata kelola tugas, gunakan kebijakan sampel:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:ListClusters", "sagemaker:DescribeCluster", "sagemaker:ListComputeQuotas", "sagemaker:CreateComputeQuota", "sagemaker:UpdateComputeQuota", "sagemaker:DescribeComputeQuota", "sagemaker:DeleteComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "sagemaker:CreateClusterSchedulerConfig", "sagemaker:UpdateClusterSchedulerConfig", "sagemaker:DeleteClusterSchedulerConfig", "eks:ListAddons", "eks:CreateAddon", "eks:DescribeAddon", "eks:DescribeCluster", "eks:DescribeAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "*" } ] }

Untuk memberikan izin mengelola Amazon CloudWatch Observability Amazon EKS dan melihat dasbor HyperPod cluster melalui konsol SageMaker AI, gunakan kebijakan contoh di bawah ini:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "eks:ListAddons", "eks:CreateAddon", "eks:UpdateAddon", "eks:DescribeAddon", "eks:DescribeAddonVersions", "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:ListClusters", "sagemaker:ListComputeQuotas", "sagemaker:DescribeComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "eks:DescribeCluster", "cloudwatch:GetMetricData", "eks:AccessKubernetesApi" ], "Resource": "*" } ] }

Arahkan ke tab Dasbor di SageMaker HyperPod konsol untuk menginstal Amazon CloudWatch Observability EKS. Untuk memastikan metrik terkait tata kelola tugas disertakan dalam Dasbor, aktifkan kotak centang metrik Kueue. Mengaktifkan metrik Kueue memungkinkan biaya Metrik, setelah CloudWatch batas tingkat bebas tercapai. Untuk informasi selengkapnya, lihat Metrik di CloudWatchHarga Amazon.

Setup using the EKS AWS CLI

Gunakan AWS CLI perintah EKS berikut untuk menginstal add-on:

aws eks create-addon --cluster-name cluster-name --addon-name amazon-cloudwatch-observability --configuration-values "configuration json"

Di bawah ini adalah contoh JSON dari nilai konfigurasi:

{ "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } } }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }
Setup using the EKS Console UI
  1. Arahkan ke konsol EKS.

  2. Pilih cluster Anda.

  3. Pilih Add-on.

  4. Temukan add-on Amazon CloudWatch Observability dan instal. Instal versi >= 2.4.0 untuk add-on.

  5. Sertakan JSON berikut, nilai Konfigurasi:

    { "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } }, }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }

Setelah add-on EKS Observability berhasil diinstal, Anda dapat melihat metrik kluster EKS Anda di bawah tab Dasbor HyperPod konsol.