Pengaturan dasbor - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pengaturan dasbor

Gunakan informasi berikut untuk menyiapkan add-on Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS. Ini membuat Anda siap dengan dasbor visual terperinci yang menyediakan tampilan metrik untuk perangkat keras kluster EKS, alokasi tim, dan tugas Anda.

Jika Anda mengalami masalah saat menyiapkan, silakan lihat Pemecahan Masalah untuk solusi pemecahan masalah yang diketahui.

HyperPod Prasyarat add-on Amazon CloudWatch Observability EKS

Bagian berikut mencakup prasyarat yang diperlukan sebelum menginstal add-on Amazon EKS Observability.

  • Pastikan Anda memiliki kebijakan izin minimum untuk administrator HyperPod klaster, diPengguna IAM untuk admin cluster.

  • Lampirkan sebuah kebijakan ke peran IAM simpul pekerja Anda. Untuk melakukan hal itu, masukkan perintah berikut. Ganti my-worker-node-role dengan peran IAM yang digunakan oleh simpul pekerja Kubernetes Anda.

    aws iam attach-role-policy \ --role-name my-worker-node-role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy

HyperPod Penyiapan add-on Amazon CloudWatch Observability EKS

Gunakan opsi berikut untuk menyiapkan add-on Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS.

Setup using the SageMaker AI console

Izin berikut diperlukan untuk penyiapan dan visualisasi dasbor tata kelola HyperPod tugas. Bagian ini memperluas izin yang tercantum di. Pengguna IAM untuk admin cluster

Untuk mengelola tata kelola tugas, gunakan kebijakan sampel:

JSON
JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:ListClusters", "sagemaker:DescribeCluster", "sagemaker:ListComputeQuotas", "sagemaker:CreateComputeQuota", "sagemaker:UpdateComputeQuota", "sagemaker:DescribeComputeQuota", "sagemaker:DeleteComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "sagemaker:CreateClusterSchedulerConfig", "sagemaker:UpdateClusterSchedulerConfig", "sagemaker:DeleteClusterSchedulerConfig", "eks:ListAddons", "eks:CreateAddon", "eks:DescribeAddon", "eks:DescribeCluster", "eks:DescribeAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "*" } ] }

Untuk memberikan izin mengelola Amazon CloudWatch Observability Amazon EKS dan melihat dasbor HyperPod cluster melalui konsol SageMaker AI, gunakan kebijakan contoh di bawah ini:

JSON
JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "eks:ListAddons", "eks:CreateAddon", "eks:UpdateAddon", "eks:DescribeAddon", "eks:DescribeAddonVersions", "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:ListClusters", "sagemaker:ListComputeQuotas", "sagemaker:DescribeComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "eks:DescribeCluster", "cloudwatch:GetMetricData", "eks:AccessKubernetesApi" ], "Resource": "*" } ] }

Arahkan ke tab Dasbor di SageMaker HyperPod konsol untuk menginstal Amazon CloudWatch Observability EKS. Untuk memastikan metrik terkait tata kelola tugas disertakan dalam Dasbor, aktifkan kotak centang metrik Kueue. Mengaktifkan metrik Kueue memungkinkan biaya Metrik, setelah CloudWatch batas tingkat bebas tercapai. Untuk informasi selengkapnya tentang penentuan harga metrik, lihat Penentuan Harga Amazon.

Setup using the EKS AWS CLI

Masukkan perintah berikut untuk melakukan instalasi add-on tersebut:

aws eks create-addon --cluster-name cluster-name --addon-name amazon-cloudwatch-observability --configuration-values "configuration json"

Di bawah ini adalah contoh JSON dari nilai konfigurasi:

{ "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } } }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }
Setup using the EKS Console UI
  1. Navigasikan ke konsol tersebut.

  2. Pilih filter Anda.

  3. Pilih Add-on.

  4. Temukan add-on Amazon CloudWatch Observability dan instal. Instal versi >= 2.4.0 untuk add-on.

  5. Untuk Konfigurasi input, gunakan nilai berikut:

    { "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } }, }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }

Setelah add-on EKS Observability berhasil diinstal, Anda dapat melihat metrik kluster EKS Anda di bawah tab Dasbor HyperPod konsol.