Persyaratan komputasi untuk model Amazon Nova 1 Persyaratan komputasi untuk model Amazon Nova 2

Kustomisasi Amazon Nova di Amazon SageMaker HyperPod

Anda dapat menyesuaikan model Amazon Nova, termasuk model Nova 2.0 yang disempurnakan, menggunakan resep Amazon Nova dan melatihnya di Amazon SageMaker HyperPod. Resep adalah file konfigurasi YAMM yang memberikan detail ke SageMaker AI tentang cara menjalankan pekerjaan penyesuaian model Anda. Amazon SageMaker HyperPod mendukung dua jenis layanan: Forge dan Non-Forge.

Amazon SageMaker HyperPod menawarkan komputasi berkinerja tinggi dengan instans GPU yang dioptimalkan dan Amazon FSx untuk penyimpanan Lustre, pemantauan yang kuat melalui integrasi dengan alat seperti TensorBoard, manajemen pos pemeriksaan yang fleksibel untuk peningkatan berulang, penerapan tanpa batas ke Amazon Bedrock untuk inferensi, dan pelatihan terdistribusi multi-node yang efisien yang dapat diskalakan - semuanya bekerja sama untuk menyediakan organisasi dengan lingkungan yang aman, berkinerja, dan fleksibel untuk menyesuaikan model Nova dengan kebutuhan bisnis spesifik mereka.

Kustomisasi Amazon Nova di Amazon SageMaker HyperPod menyimpan artefak model termasuk pos pemeriksaan model dalam ember Amazon S3 yang dikelola layanan. Artefak dalam bucket yang dikelola layanan dienkripsi dengan kunci -managed. SageMaker AWS KMS Bucket Amazon S3 yang dikelola layanan saat ini tidak mendukung enkripsi data menggunakan kunci KMS yang dikelola pelanggan. Anda dapat menggunakan lokasi pos pemeriksaan ini untuk pekerjaan evaluasi atau inferensi Amazon Bedrock.

Harga standar dapat berlaku untuk instans komputasi, penyimpanan Amazon S3, dan untuk Lustre. FSx Untuk detail harga, lihat SageMaker HyperPodharga, harga Amazon S3, dan FSx untuk harga Lustre.

Persyaratan komputasi untuk model Amazon Nova 1

Tabel berikut merangkum persyaratan komputasi untuk SageMaker HyperPod dan pelatihan pekerjaan pelatihan SageMaker AI untuk model Nova 1.0.

Pra-pelatihan
Model	Panjang urutan	Node	Instans	Akselerator
Amazon Nova Mikro	8,192	8	ml.p5.48xbesar	GPU H100
Amazon Nova Lite	8,192	16	ml.p5.48xbesar	GPU H100
Amazon Nova Pro	8,192	12	ml.p5.48xbesar	GPU H100

Optimalisasi preferensi langsung (DPO)
Model	Panjang urutan	Jumlah node	Instans	Akselerator
Optimasi Preferensi Langsung (Penuh)	32,768	2, 4, atau 6	ml.p5.48xbesar	GPU H100
Optimasi Preferensi Langsung (LoRa)	32,768	2, 4, atau 6	ml.p5.48xbesar	GPU H100

Penyetelan halus
Model	Teknik	Panjang urutan	Jumlah node	Instans	Akselerator
Amazon Nova 1 Mikro	Fine-Tuning yang Diawasi (LoRa)	65,536	2	ml.p5.48xbesar	GPU H100
Amazon Nova 1 Mikro	Fine-Tuning yang Diawasi (Lengkap)	65,536	2	ml.p5.48xbesar	GPU H100
Amazon Nova 1 Lite	Fine-Tuning yang Diawasi (LoRa)	32,768	4	ml.p5.48xbesar	GPU H100
Amazon Nova 1 Lite	Fine-Tuning yang Diawasi (Lengkap)	65,536	4	ml.p5.48xbesar	GPU H100
Amazon Nova 1 Pro	Fine-Tuning yang Diawasi (LoRa)	65,536	6	ml.p5.48xbesar	GPU H100
Amazon Nova 1 Pro	Fine-Tuning yang Diawasi (Lengkap)	65,536	6	ml.p5.48xbesar	GPU H100

Distilasi
Model	Node	Instans
Model Distilasi untuk Pasca Pelatihan	1	ml.r5.24xlarge

Evaluasi
Model	Panjang urutan	Node	Instans	Akselerator
Resep Benchmark Teks Umum	8,192	1	ml.p5.48xbesar	GPU H100
Bawa Resep benchmark dataset (gen_qa) Anda sendiri	8,192	1	ml.p5.48xbesar	GPU H100
Amazon Nova LLM sebagai Resep Hakim	8,192	1	ml.p5.48xbesar	GPU H100
Tolok Ukur Teks Standar	8,192	1	ml.p5.48xbesar	GPU H100
Evaluasi Dataset Kustom	8,192	1	ml.p5.48xbesar	GPU H100
Tolok Ukur Multi-Modal	8,192	1	ml.p5.48xbesar	GPU H100

Optimalisasi kebijakan proksimal
Model	Hitungan Contoh Model Kritikus	Hitungan Instans Model Hadiah	Hitungan Instance Model Jangkar	Kereta Aktor	Generasi Aktor	Jumlah Instance	Total Jam Per Lari	Jam P5	Tipe Instans
Amazon Nova Mikro	1	1	1	2	2	7	8	56	ml.p5.48xbesar
Amazon Nova Lite	1	1	1	2	2	7	16	112	ml.p5.48xbesar
Amazon Nova Pro	1	1	1	6	2	11	26	260	ml.p5.48xbesar

Persyaratan komputasi untuk model Amazon Nova 2

Tabel berikut merangkum persyaratan komputasi untuk SageMaker HyperPod dan pelatihan pekerjaan pelatihan SageMaker AI untuk model Nova 2.

Persyaratan Pelatihan Nova 2
Teknik Pelatihan	Contoh Minimum	Tipe Instans	Hitungan GPU	Catatan
SFT (LoRa)	4	P5.48xBesar	16	Penyetelan halus yang hemat parameter
SFT (Peringkat Penuh)	4	P5.48xBesar	32	Penyetelan halus model lengkap
RFT pada Pekerjaan Pelatihan SageMaker AI (LoRa)	2	P5.48xBesar	16	Fungsi Hadiah Kustom di AWS Lingkungan Anda
RFT pada Pekerjaan Pelatihan SageMaker AI (Peringkat Penuh)	4	P5.48xBesar	32	Panjang konteks 32K
RFT pada SageMaker HyperPod	8	P5.48xBesar	64	Panjang konteks standar 8192
CPT	2	P5.48xBesar	16	Memproses sekitar 1.25B token per hari

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Menjalankan evaluasi

SDK Kustomisasi Nova