Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon SageMaker AI meningkatkan metrik untuk titik akhir inferensi
Metrik yang disempurnakan menyediakan data pemantauan tingkat instans dan tingkat kontainer untuk titik akhir real-time Amazon AI. SageMaker Saat Anda mengaktifkan metrik yang disempurnakan, CloudWatch metrik Amazon dapat menyertakan InstanceIdContainerId, dan AcceleratorId dimensi (ketersediaan bervariasi menurut namespace) untuk visibilitas granular per instance, per-container, dan per-GPU. Metrik yang disempurnakan tersedia untuk titik akhir model tunggal dan komponen inferensi. Multi-Container Endpoints (MCE) mendukung metrik yang ditingkatkan tingkat instans tetapi bukan metrik tingkat kontainer.
Karakteristik utama dari metrik yang ditingkatkan:
-
Instance-level granularitas. Metrik pemanfaatan dan pemanggilan mencakup
InstanceIddimensi yang mengidentifikasi instance spesifik yang menghosting titik akhir. Ini tersedia untuk semua titik akhir real-time. -
Container-level granularitas. Untuk titik akhir yang menggunakan komponen inferensi, metrik menyertakan
ContainerIddimensi yang mengidentifikasi wadah tertentu yang menjalankan model. Container-level dimensi muncul diAWS/SageMakernamespace (metrik pemanggilan) dan/aws/sagemaker/InferenceComponentsnamespace (metrik pemanfaatan). -
Per-GPU granularitas. Metrik pemanfaatan GPU mencakup
AcceleratorIddimensi yang mengidentifikasi GPU tertentu pada sebuah instance. -
Frekuensi penerbitan yang dapat dikonfigurasi. Anda dapat mengonfigurasi interval penerbitan metrik menjadi 10, 30, 60, 120, 180, 240, atau 300 detik. Bawaannya adalah 60 detik. Interval ini berlaku untuk metrik pemanfaatan terlepas dari apakah metrik yang ditingkatkan diaktifkan. Dengan metrik yang disempurnakan diaktifkan, ini juga berlaku untuk metrik pemanggilan.
Mengaktifkan metrik yang disempurnakan
Anda mengaktifkan metrik yang disempurnakan dengan EnableEnhancedMetrics menyetel ke True dalam MetricsConfigparameter saat Anda memanggil CreateEndpointConfigAPI.
MetricsConfigParameter memiliki bidang berikut:
| Parameter | Tipe | Diperlukan | Default | Deskripsi |
|---|---|---|---|---|
EnableEnhancedMetrics |
Boolean | Tidak | False |
Mengaktifkan dimensi metrik tingkat instans dan tingkat kontainer. |
MetricPublishFrequencyInSeconds |
Bilangan Bulat | Tidak | 60 |
Interval, dalam hitungan detik, di mana metrik diterbitkan ke Amazon CloudWatch. Default ke |
catatan
MetricsConfigdiatur pada tingkat konfigurasi titik akhir. Anda tidak dapat mengonfigurasi pengaturan berbeda untuk komponen inferensi individual pada titik akhir yang sama.
Untuk mengaktifkan metrik yang disempurnakan pada titik akhir yang ada, buat konfigurasi titik akhir baru dengan MetricsConfig pengaturan yang diinginkan, lalu panggil UpdateEndpointdengan nama konfigurasi titik akhir yang baru. Ini memicu penerapan blue/green atau bergulir. Metrik yang disempurnakan tidak muncul sampai penerapan selesai. Proses yang sama berlaku saat mengubah MetricsConfig pengaturan pada titik akhir yang sudah dikonfigurasi.
Saat Anda mengonfigurasiMetricsConfig, keduanya DescribeEndpointdan DescribeEndpointConfigkembali MetricsConfig dalam respons.
Saat Anda mengaktifkan metrik yang disempurnakan, SageMaker AI menambahkan dimensi tambahan ke metrik di tiga CloudWatch ruang nama: untuk metrik pemanfaatan, /aws/sagemaker/Endpoints untuk metrik pemanggilan, dan AWS/SageMaker untuk metrik pemanfaatan komponen inferensi. /aws/sagemaker/InferenceComponents
Instance-level metrik pemanfaatan
/aws/sagemaker/EndpointsNamespace mencakup metrik pemanfaatan untuk semua titik akhir real-time, termasuk yang menggunakan komponen inferensi. Saat Anda mengaktifkan metrik yang disempurnakan, dimensi InstanceId dan AcceleratorId (hanya metrik GPU) tersedia bersama dimensi namespace yang ada. Untuk daftar lengkap metrik dan dimensi, lihatSageMaker Metrik titik akhir AI.
Saat Anda mengaktifkan metrik yang disempurnakan, dimensi tambahan berikut tersedia:
| Dimensi | Deskripsi |
|---|---|
InstanceId |
Filter metrik pemanfaatan untuk contoh tertentu. |
AcceleratorId |
(Hanya metrik GPU) Filter metrik pemanfaatan untuk GPU tertentu. |
Metrik pemanggilan tingkat instans dan kontainer
AWS/SageMakerNamespace menyertakan metrik pemanggilan. Saat Anda mengaktifkan metrik yang disempurnakan, dimensi InstanceId dan ContainerId (hanya komponen inferensi) tersedia bersama dimensi namespace yang ada. Untuk daftar lengkap metrik dan dimensi, lihatSageMaker Metrik pemanggilan titik akhir AI.
Saat Anda mengaktifkan metrik yang disempurnakan, dimensi tambahan berikut tersedia:
| Dimensi | Deskripsi |
|---|---|
InstanceId |
Memfilter metrik pemanggilan untuk instance tertentu. |
ContainerId |
(Hanya komponen inferensi) Memfilter metrik pemanggilan untuk wadah tertentu. |
Container-level metrik pemanfaatan
/aws/sagemaker/InferenceComponentsNamespace mencakup metrik pemanfaatan untuk titik akhir yang menggunakan komponen inferensi. Saat Anda mengaktifkan metrik yang disempurnakanInstanceId, dimensiContainerId,, dan AcceleratorId (hanya metrik GPU) tersedia bersama dimensi namespace yang ada. Untuk daftar lengkap metrik dan dimensi, lihatSageMaker Metrik komponen inferensi AI.
Saat Anda mengaktifkan metrik yang disempurnakan, dimensi tambahan berikut tersedia:
| Dimensi | Deskripsi |
|---|---|
InstanceId |
Filter metrik pemanfaatan untuk contoh tertentu. |
ContainerId |
Filter metrik pemanfaatan untuk wadah tertentu. |
AcceleratorId |
(Hanya metrik GPU) Filter metrik pemanfaatan untuk GPU tertentu. |
Frekuensi metrik yang dapat dikonfigurasi
Anda dapat mengonfigurasi interval di mana metrik dipublikasikan. CloudWatch Frekuensi default adalah 60 detik.
Nilai yang valid: 10, 30, 60, 120, 180, 240, atau 300 detik.
Ketika EnableEnhancedMetrics disetel keFalse, frekuensi ini hanya berlaku untuk metrik pemanfaatan; metrik pemanggilan terus dipublikasikan pada interval default 60 detik. Ketika disetel keTrue, frekuensi ini berlaku untuk metrik pemanfaatan dan pemanggilan.
catatan
Metrik yang diterbitkan pada interval kurang dari 60 detik (resolusi tinggi) dipertahankan selama 3 jam.
CloudWatch Harga standar berlaku per metrik per kombinasi dimensi unik. Metrik yang disempurnakan meningkatkan jumlah aliran metrik karena setiap instance, container, dan GPU menciptakan kombinasi dimensi tambahan. Untuk detail harga, lihat CloudWatch harga Amazon
Contoh kode: konfigurasikan metrik yang disempurnakan
Contoh berikut menunjukkan cara membuat konfigurasi titik akhir dengan metrik yang disempurnakan diaktifkan dan cara memverifikasi konfigurasi.