Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pantau pekerjaan pelatihan RFT Anda
Selama fine-tuning penguatan, Anda dapat memantau kemajuan pelatihan secara real-time menggunakan grafik dan metrik visual di konsol Amazon Bedrock. Dasbor metrik pelatihan menunjukkan indikator kinerja utama termasuk skor hadiah, kurva kerugian, dan peningkatan akurasi dari waktu ke waktu. Metrik ini membantu Anda memahami apakah model menyatu dengan benar dan apakah fungsi hadiah secara efektif memandu proses pembelajaran.
Metrik pelatihan waktu nyata
Amazon Bedrock menyediakan pemantauan waktu nyata selama pelatihan RFT dengan grafik visual yang menampilkan metrik pelatihan dan validasi.
Metrik pelatihan inti
-
Kehilangan pelatihan - Mengukur seberapa baik model belajar dari data pelatihan
-
Statistik hadiah pelatihan - Menampilkan skor hadiah yang ditetapkan oleh fungsi hadiah Anda
-
Margin hadiah - Mengukur perbedaan antara imbalan respons baik dan buruk
-
Akurasi pada set pelatihan dan validasi - Menunjukkan kinerja model pada data pelatihan dan held-out
Visualisasi kemajuan pelatihan
Konsol menampilkan grafik interaktif yang diperbarui secara real-time saat pekerjaan RFT Anda berlangsung. Visualisasi ini dapat membantu Anda:
-
Lacak konvergensi menuju kinerja optimal
-
Identifikasi potensi masalah pelatihan lebih awal
-
Tentukan titik berhenti yang optimal
-
Bandingkan kinerja di berbagai zaman
Pelacakan status Job
Pantau status pekerjaan RFT Anda melalui konsol Amazon Bedrock.
Fase Job:
-
Validasi
-
Pelatihan
Indikator penyelesaian:
-
Status Job berubah menjadi Selesai saat pelatihan berhasil diselesaikan
-
Model khusus ARN menjadi tersedia untuk penerapan
-
Metrik pelatihan mencapai ambang konvergensi