Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Terapkan model Anda dalam skala besar
Siapkan auto-scaling CloudWatch dan monitoring untuk titik akhir AI SageMaker Anda agar siap produksi.
Mengapa pemantauan produksi penting untuk klasifikasi teks
Beban kerja klasifikasi teks memerlukan pemantauan karena:
Rasakan pola lalu lintas variabel dengan ledakan pemrosesan.
Membutuhkan waktu respons sub-detik.
Perlu pengoptimalan biaya melalui auto-scaling.
Prasyarat
Sebelum Anda mulai, pastikan Anda memiliki:
Titik akhir SageMaker AI Anda diterapkan dari bagian sebelumnya.
Nama titik akhir Anda (misalnya, jumpstart-dft-hf-tc).
Anda Wilayah AWS (misalnya, us-east-2).
Untuk pembuatan atau pemecahan masalah titik akhir, lihat Inferensi waktu nyata.
Mengatur pemantauan produksi
Konfigurasikan CloudWatch pemantauan untuk melacak kinerja model Anda dalam produksi.
-
Di JupyterLab ruang Anda, buka
sagemaker_production_monitoring.ipynbbuku catatan dari paket evaluasi yang Anda unggah sebelumnya. -
Perbarui nama dan wilayah titik akhir Anda di bagian konfigurasi.
-
Ikuti instruksi buku catatan untuk mengatur:
Penskalaan otomatis (1-10 instance berdasarkan lalu lintas).
CloudWatch alarm untuk ambang batas latensi dan pemanggilan.
Dasbor metrik untuk pemantauan visual.
Verifikasi pengaturan Anda
Setelah Anda menyelesaikan langkah-langkah buku catatan, verifikasi bahwa Anda memiliki:
Status Titik Akhir:
InService.Penskalaan otomatis: 1-10 instance dikonfigurasi.
CloudWatch Alarm: 2 alarm pemantauan.
Metrik: 15+ metrik terdaftar.
catatan
Alarm mungkin muncul INSUFFICIENT_DATA pada awalnya - ini normal dan akan berubah OK dengan penggunaan.
Pantau titik akhir Anda
Akses pemantauan visual melalui Konsol AWS Manajemen:
Untuk informasi lebih lanjut, lihat Monitor SageMaker AI.
Mengelola biaya dan membersihkan sumber daya
Pengaturan pemantauan Anda memberikan wawasan produksi yang berharga, tetapi juga menimbulkan AWS biaya berkelanjutan melalui CloudWatch metrik, alarm, dan kebijakan auto-scaling. Memahami cara mengelola biaya ini sangat penting untuk operasi yang hemat biaya. Bersihkan sumber daya ketika mereka tidak lagi dibutuhkan.
Awas
Titik akhir Anda terus dikenakan biaya bahkan saat tidak memproses permintaan. Untuk menghentikan semua tagihan, Anda harus menghapus titik akhir Anda. Untuk petunjuk, lihat Menghapus Titik Akhir dan Sumber Daya.
Untuk konfigurasi pemantauan lanjutan, lihat CloudWatch Metrik untuk SageMaker AI.