Pelatihan berulang - Amazon Nova

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pelatihan berulang

Pelatihan berulang adalah pendekatan sistematis untuk menyempurnakan model melalui beberapa siklus pelatihan, di mana setiap putaran dibangun di atas pos pemeriksaan sebelumnya dengan mengatasi kelemahan spesifik yang ditemukan melalui evaluasi. Metode ini memungkinkan peningkatan yang ditargetkan untuk memodelkan kinerja dengan memasukkan contoh yang dikuratori yang membahas mode kegagalan, beradaptasi dengan perubahan persyaratan, dan memvalidasi peningkatan secara bertahap daripada berkomitmen pada satu pelatihan jangka panjang. Prosesnya biasanya mengikuti pola seperti SFT (Supervised Fine-Tuning) diikuti oleh RFT (Reward-based Fine-Tuning), dengan pos pemeriksaan yang disimpan dalam bucket S3 escrow yang AWS dikelola yang dapat direferensikan untuk iterasi pelatihan berikutnya sambil mempertahankan konsistensi dalam jenis model dan teknik pelatihan di seluruh pipeline.

Untuk detail selengkapnya, lihat Pelatihan Iteratif.