Pra-pelatihan lanjutan (CPT)

Pre-training lanjutan (CPT) adalah teknik pelatihan yang memperluas fase pra-pelatihan model yayasan dengan mengeksposnya ke teks tambahan yang tidak berlabel dari domain atau korpora tertentu. Tidak seperti fine-tuning yang diawasi, yang membutuhkan pasangan input-output berlabel, CPT melatih dokumen mentah untuk membantu model memperoleh pengetahuan yang lebih dalam tentang domain baru, mempelajari terminologi dan pola penulisan khusus domain, dan beradaptasi dengan jenis konten atau area subjek tertentu.

Pendekatan ini sangat berharga ketika Anda memiliki volume besar (puluhan miliar token) data teks khusus domain, seperti dokumen hukum, literatur medis, dokumentasi teknis, atau konten bisnis berpemilik, dan Anda ingin model tersebut mengembangkan kefasihan asli dalam domain itu. Umumnya, setelah tahap CPT, model perlu menjalani tahap penyetelan instruksi tambahan untuk memungkinkan model menggunakan pengetahuan yang baru diperoleh dan menyelesaikan tugas yang berguna.

Model yang didukung

CPT tersedia untuk model Amazon Nova berikut:

Nova 1.0 (Mikro, Lite, Pro)
Nova 2.0 (Ringan)

Kapan menggunakan Nova 1.0 versus Nova 2.0

Rangkaian model Amazon Nova menawarkan beberapa titik operasi kinerja harga untuk mengoptimalkan antara akurasi, kecepatan, dan biaya.

Pilih Nova 2.0 saat Anda membutuhkan yang berikut:

Kemampuan penalaran tingkat lanjut untuk tugas analitis yang kompleks
Kinerja unggul dalam pengkodean, matematika, dan pemecahan masalah ilmiah
Dukungan panjang konteks yang lebih panjang
Performa multibahasa yang lebih baik

Pilih Nova 1.0 jika hal berikut berlaku:

Kasus penggunaan Anda memerlukan pemahaman bahasa standar tanpa alasan lanjutan.
Anda ingin mengoptimalkan biaya pelatihan dan inferensi yang lebih rendah.
Fokus Anda adalah mengajarkan pengetahuan dan perilaku spesifik domain model daripada tugas penalaran yang kompleks.
Anda telah memvalidasi kinerja di Nova 1.0 dan tidak memerlukan kemampuan tambahan.

catatan

Model yang lebih besar tidak selalu lebih baik. Pertimbangkan tradeoff kinerja biaya dan persyaratan bisnis spesifik Anda saat memilih antara model Nova 1.0 dan Nova 2.0.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pelatihan

CPT pada Nova 1.0