

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Terapkan model Anda dalam skala besar
<a name="jumpstart-text-classification-scale"></a>

Siapkan auto-scaling CloudWatch dan monitoring untuk titik akhir AI SageMaker Anda agar siap produksi.

## Mengapa pemantauan produksi penting untuk klasifikasi teks
<a name="w2aac37c15c27b5"></a>

Beban kerja klasifikasi teks memerlukan pemantauan karena:
+ Rasakan pola lalu lintas variabel dengan ledakan pemrosesan.
+ Membutuhkan waktu respons sub-detik.
+ Perlu pengoptimalan biaya melalui auto-scaling.

## Prasyarat
<a name="w2aac37c15c27b7"></a>

Sebelum Anda mulai, pastikan Anda memiliki:
+ Titik akhir SageMaker AI Anda diterapkan dari bagian sebelumnya.
+ Nama titik akhir Anda (misalnya, jumpstart-dft-hf-tc).
+ Anda Wilayah AWS (misalnya, us-east-2).

[Untuk pembuatan atau pemecahan masalah titik akhir, lihat Inferensi waktu nyata.](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html)

## Mengatur pemantauan produksi
<a name="w2aac37c15c27b9"></a>

Konfigurasikan CloudWatch pemantauan untuk melacak kinerja model Anda dalam produksi.

1. Di JupyterLab ruang Anda, buka `sagemaker_production_monitoring.ipynb` buku catatan dari paket evaluasi yang Anda unggah sebelumnya.

1. Perbarui nama dan wilayah titik akhir Anda di bagian konfigurasi.

1. Ikuti instruksi buku catatan untuk mengatur:
   + Penskalaan otomatis (1-10 instance berdasarkan lalu lintas).
   + CloudWatch alarm untuk ambang batas latensi dan pemanggilan.
   + Dasbor metrik untuk pemantauan visual.

## Verifikasi pengaturan Anda
<a name="w2aac37c15c27c11"></a>

Setelah Anda menyelesaikan langkah-langkah buku catatan, verifikasi bahwa Anda memiliki:
+ **Status Titik Akhir**:`InService`.
+ **Penskalaan otomatis**: 1-10 instance dikonfigurasi.
+ **CloudWatch Alarm**: 2 alarm pemantauan.
+ **Metrik**: 15\+ metrik terdaftar.

**catatan**  
Alarm mungkin muncul `INSUFFICIENT_DATA` pada awalnya - ini normal dan akan berubah `OK` dengan penggunaan.

## Pantau titik akhir Anda
<a name="w2aac37c15c27c13"></a>

Akses pemantauan visual melalui Konsol AWS Manajemen:
+ [CloudWatch Metrik-metrik](https://console.aws.amazon.com/cloudwatch/home#metricsV2:graph=~();query=AWS/SageMaker)
+ [CloudWatch Alarm](https://console.aws.amazon.com/cloudwatch/home#alarmsV2:)

Untuk informasi lebih lanjut, lihat [Monitor SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-overview.html).

## Mengelola biaya dan membersihkan sumber daya
<a name="w2aac37c15c27c15"></a>

Pengaturan pemantauan Anda memberikan wawasan produksi yang berharga, tetapi juga menimbulkan AWS biaya berkelanjutan melalui CloudWatch metrik, alarm, dan kebijakan auto-scaling. Memahami cara mengelola biaya ini sangat penting untuk operasi yang hemat biaya. Bersihkan sumber daya ketika mereka tidak lagi dibutuhkan.

**Awas**  
Titik akhir Anda terus dikenakan biaya bahkan saat tidak memproses permintaan. Untuk menghentikan semua tagihan, Anda harus menghapus titik akhir Anda. Untuk petunjuk, lihat [Menghapus Titik Akhir dan Sumber Daya](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints-delete-resources.html).

Untuk konfigurasi pemantauan lanjutan, lihat [CloudWatch Metrik untuk SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).