Persyaratan model untuk kumpulan data pelatihan dan validasi - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Persyaratan model untuk kumpulan data pelatihan dan validasi

Bagian berikut mencantumkan persyaratan untuk kumpulan data pelatihan dan validasi untuk model. Untuk informasi tentang batasan kumpulan data untuk model, lihat Amazon Nova Model fine-tuning. Amazon Nova

Deskripsi Maksimum (Fine-tuning)
Jumlah token input dan output saat ukuran batch adalah 1 4,096
Jumlah token input dan output saat ukuran batch adalah 2, 3, atau 4 N/A
Kuota karakter per sampel dalam dataset Kuota token x 6 (perkiraan)
Ukuran file kumpulan data pelatihan 1 GB
Ukuran file dataset validasi 100 MB
Deskripsi Maksimum (Lanjutan Pra-pelatihan) Maksimum (Fine-tuning)
Jumlah token input dan output saat ukuran batch adalah 1 4,096 4,096
Jumlah token input dan output saat ukuran batch adalah 2, 3, atau 4 2,048 2,048
Kuota karakter per sampel dalam dataset Kuota token x 6 (perkiraan) Kuota token x 6 (perkiraan)
Ukuran file kumpulan data pelatihan 10 GB 1 GB
Ukuran file dataset validasi 100 MB 100 MB
Deskripsi Maksimum (Lanjutan Pra-pelatihan) Maksimum (Fine-tuning)
Jumlah token input dan output saat ukuran batch adalah 1 atau 2 4,096 4,096
Jumlah token input dan output saat ukuran batch adalah 3, 4, 5, atau 6 2,048 2,048
Kuota karakter per sampel dalam dataset Kuota token x 6 (perkiraan) Kuota token x 6 (perkiraan)
Ukuran file kumpulan data pelatihan 10 GB 1 GB
Ukuran file dataset validasi 100 MB 100 MB
Deskripsi Minimum (Fine-tuning) Maksimum (Fine-tuning)
Panjang prompt teks dalam sampel pelatihan, dalam karakter 3 1,024
Catatan dalam kumpulan data pelatihan 5 10.000
Ukuran gambar masukan 0 50 MB
Input tinggi gambar dalam piksel 512 4,096
Masukan lebar gambar dalam piksel 512 4,096
Masukan total piksel gambar 0 12,582,912
Rasio aspek gambar masukan 1:4 4:1
Deskripsi Minimum (Fine-tuning) Maksimum (Fine-tuning)
Panjang prompt teks dalam sampel pelatihan, dalam karakter 0 2,560
Catatan dalam kumpulan data pelatihan 1.000 500.000
Ukuran gambar masukan 0 5 MB
Input tinggi gambar dalam piksel 128 4096
Masukan lebar gambar dalam piksel 128 4096
Masukan total piksel gambar 0 12,528,912
Rasio aspek gambar masukan 1:4 4:1
Deskripsi Minimum (Fine-tuning) Maksimum (Fine-tuning)
Token masukan 0 16.000
Token keluaran 0 16.000
Kuota karakter per sampel dalam dataset 0 Kuota token x 6 (perkiraan)
Jumlah token Input dan Output 0 16.000
Jumlah catatan pelatihan dan validasi 100 10.000 (dapat disesuaikan menggunakan kuota layanan)

Format gambar yang didukung untuk Meta Llama-3.2 11B Vision Instruct dan Meta Llama-3.2 90B Vision Instruct termasuk:gif,jpeg,png, danwebp. Untuk memperkirakan image-to-token konversi selama fine-tuning model ini, Anda dapat menggunakan rumus ini sebagai perkiraan:. Tokens = min(2, max(Height // 560, 1)) * min(2, max(Width // 560, 1)) * 1601 Gambar dikonversi menjadi sekitar 1.601 hingga 6.404 token berdasarkan ukurannya.

Deskripsi Minimum (Fine-tuning) Maksimum (Fine-tuning)
Jumlah token Input dan Output 0 16.000 (10000 untuk Meta Llama 3.2 90B)
Jumlah catatan pelatihan dan validasi 100 10.000 (dapat disesuaikan menggunakan kuota layanan)
Masukan ukuran gambar untuk Meta Llama 11B and 90B instruct model) 0 10 MB
Masukkan tinggi gambar dalam piksel untuk Meta Llama 11B and 90B instruct model 10 8192
Masukan lebar gambar dalam piksel untuk Meta Llama 11B and 90B90B instruct model 10 8192
Deskripsi Maksimum (Fine-tuning)
Token masukan 4,096
Token keluaran 2,048
Kuota karakter per sampel dalam dataset Kuota token x 6 (perkiraan)
Catatan dalam kumpulan data pelatihan 10.000
Merekam dalam kumpulan data validasi 1.000
Deskripsi Maksimum (Fine-tuning)
Jumlah catatan minimum 32
Catatan pelatihan maksimum 10.000
Catatan validasi maksimum 1.000
Total catatan maksimum 10.000 (dapat disesuaikan menggunakan kuota layanan)
Token maksimum 32.000
Ukuran dataset pelatihan maksimum 10 GB
Ukuran dataset validasi maksimum 1 GB