Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon NovaModel fine-tune dengan fine-tuning yang diawasi
Amazon NovaData 2.0 SFT menggunakan format Converse API yang sama dengan Amazon Nova 1.0, dengan penambahan bidang konten penalaran opsional. Untuk spesifikasi format lengkap, lihat ReasoningContentBlockdan skema Converse API.
Fitur yang didukung:
Jenis input - Teks, gambar, atau video di blok konten pengguna
Konten asisten - Tanggapan khusus teks dan konten penalaran
Komposisi dataset — Harus homogen. Pilih salah satu dari berikut ini: belokan teks saja, teks + gambar berubah, atau teks+video berubah
penting
Anda tidak dapat mencampur gambar dan video dalam kumpulan data yang sama atau di belokan yang berbeda.
Keterbatasan saat ini:
Penggunaan alat - Meskipun penggunaan alat didukung dalam format input, saat ini tidak didukung oleh Amazon Nova 2.0 SFT. Menambahkan bagian alat dapat menyebabkan pekerjaan Anda gagal.
Konten penalaran multimodal - Meskipun format Converse mendukung konten penalaran berbasis gambar, ini tidak didukung oleh 2.0 SFT. Amazon Nova
Set validasi - Menyediakan set validasi mungkin didukung melalui UI tetapi tidak akan didukung selama pelatihan SFT.
Format media yang didukung:
Gambar - PNG, JPEG, GIF
Video - MOV, MKV, MP4
Contoh format data
Konten penalaran
Konten penalaran (juga disebut chain-of-thought) menangkap langkah-langkah pemikiran menengah model sebelum menghasilkan jawaban akhir. Pada assistant gilirannya, gunakan reasoningContent bidang untuk memasukkan jejak penalaran ini.
Bagaimana kerugian dihitung:
Dengan konten penalaran — Kerugian pelatihan mencakup token penalaran dan token keluaran akhir
Tanpa penalaran konten - Kerugian pelatihan dihitung hanya pada token keluaran akhir
Kapan mengaktifkan mode penalaran: Atur reasoning_enabled: true konfigurasi pelatihan Anda saat Anda ingin model menghasilkan token pemikiran sebelum menghasilkan output akhir atau perlu meningkatkan kinerja pada tugas penalaran yang kompleks. Tetapkan reasoning_enabled: false saat Anda berlatih pada tugas-tugas sederhana yang tidak mendapat manfaat dari langkah-langkah penalaran eksplisit.
catatan
Anda dapat mengaktifkan mode penalaran terlepas dari apakah data pelatihan Anda berisi konten penalaran. Namun, memasukkan jejak penalaran dalam data pelatihan Anda disarankan agar model dapat belajar dari contoh-contoh ini dan meningkatkan kualitas penalaran.
Pedoman pemformatan:
Gunakan teks biasa untuk penalaran konten.
Hindari tag markup seperti
<thinking>dan</thinking>kecuali secara khusus diperlukan oleh tugas Anda.Pastikan konten penalaran jelas dan relevan dengan proses pemecahan masalah.
Konten penalaran yang efektif harus mencakup:
Pikiran dan analisis menengah
Pengurangan logis dan langkah inferensi
Step-by-step pendekatan pemecahan masalah
Hubungan eksplisit antara langkah dan kesimpulan
Jika kumpulan data Anda tidak memiliki jejak penalaran, Anda dapat membuatnya menggunakan model berkemampuan penalaran seperti Nova Premier. Berikan pasangan input-output Anda ke model dan tangkap proses penalarannya untuk membangun kumpulan data yang diperbesar dengan alasan.
Pedoman persiapan kumpulan data
Tabel berikut memberikan panduan untuk mempersiapkan dataset pelatihan Anda.
| Pedoman | Deskripsi |
|---|---|
| Ukuran dan kualitas |
|
| Keanekaragaman |
Sertakan beragam contoh yang melakukan hal berikut:
|
| Pemformatan keluaran |
Tentukan dengan jelas format output yang diinginkan dalam tanggapan asisten. Contohnya termasuk struktur JSON, tabel, format CSV, atau format kustom khusus untuk aplikasi Anda. |
| Percakapan multi-giliran |
|
| Daftar periksa kualitas |
|