Personalizzazione di Amazon Nova su Amazon SageMaker HyperPod - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Personalizzazione di Amazon Nova su Amazon SageMaker HyperPod

Puoi personalizzare i modelli Amazon Nova utilizzando le ricette di Amazon Nova e addestrarli su Amazon SageMaker HyperPod. Una ricetta è un file di configurazione YAML che fornisce dettagli all' SageMaker IA su come eseguire il processo di personalizzazione del modello.

Amazon SageMaker HyperPod offre elaborazione ad alte prestazioni con istanze GPU ottimizzate e storage Amazon FSx for Lustre, monitoraggio affidabile attraverso l'integrazione con strumenti come la gestione flessibile dei checkpoint per il miglioramento iterativo TensorBoard, la distribuzione senza interruzioni su Amazon Bedrock per l'inferenza e una formazione distribuita efficiente e scalabile a più nodi, il tutto in sinergia per fornire alle organizzazioni un ambiente sicuro, performante e flessibile per personalizzare i modelli Nova in base ai loro requisiti aziendali specifici.

La personalizzazione di Amazon Nova su Amazon SageMaker HyperPod archivia gli artefatti del modello, inclusi i checkpoint del modello, in un bucket Amazon S3 gestito dal servizio. Gli artefatti nel bucket gestito dal servizio sono crittografati con chiavi gestite. SageMaker AWS KMS I bucket Amazon S3 gestiti dai servizi attualmente non supportano la crittografia dei dati tramite chiavi KMS gestite dal cliente. Puoi utilizzare questa posizione di controllo per lavori di valutazione o inferenza su Amazon Bedrock.

I prezzi standard possono essere applicati per le istanze di calcolo, lo storage Amazon S3 e Lustre. FSx Per i dettagli sui prezzi, consulta SageMaker HyperPod i prezzi, i prezzi di Amazon S3 e i prezzi FSx di Lustre.

Requisiti di calcolo

Le tabelle seguenti riassumono i requisiti computazionali per la formazione. SageMaker HyperPod

Pre-allenamento

Modello

Lunghezza della sequenza

Nodi

Istanza

Accelerator

Amazon NovaMicro

8,192

8

ml.p 5,48 x grande

GPU H100

Amazon Nova Lite

8,192

16

ml.p 5,48 x grande

GPU H100

Amazon Nova Pro

8,192

24

ml.p 5,48 x grande

GPU H100

Ottimizzazione diretta delle preferenze (DPO)

Modello

Lunghezza della sequenza

Numero di nodi

Istanza

Accelerator

Ottimizzazione diretta delle preferenze (completa)

32,768

2, 4 o 6

ml. p 5,48 x grande

GPU H100

Ottimizzazione diretta delle preferenze (LoRa)

32,768

2, 4 o 6

ml. p 5,48 x grande

GPU H100

Ottimizzazione

Modello

Lunghezza della sequenza

Numero di nodi

Istanza

Accelerator

Ottimizzazione di precisione supervisionata (LoRa)

65.536

2

ml. p 5,48 x grande

GPU H100

Ottimizzazione di precisione supervisionata (completa)

65.536

2

ml. p 5,48 x grande

GPU H100

Ottimizzazione di precisione supervisionata (LoRa)

32,768

4

ml.p 5,48 x grande

GPU H100

Ottimizzazione di precisione supervisionata (completa)

65.536

4

ml. p 5,48 x grande

GPU H100

Ottimizzazione di precisione supervisionata (LoRa)

65.536

6

ml. p 5,48 x grande

GPU H100

Ottimizzazione di precisione supervisionata (completa)

65.536

6

ml. p 5,48 x grande

GPU H100

Distillazione

Modello

Nodi

Istanza

Modello di distillazione per il post-allenamento

1

ml.r5.24xlarge

Valutazione

Modello

Lunghezza della sequenza

Nodi

Istanza

Accelerator

Ricetta generale di benchmark testuali

8,192

1

ml.p5,48 xlarge

GPU H100

Porta il tuo set di dati (gen_qa) benchmark Recipe

8,192

1

ml.p 5,48 x large

GPU H100

Amazon Nova LLM come ricetta per giudici

8,192

1

ml.p5,48 xlarge

GPU H100

Benchmark testuali standard

8,192

1

ml.p5,48 xlarge

GPU H100

Valutazione personalizzata del set di dati

8,192

1

ml.p5.48xlarge

GPU H100

Benchmark multimodali

8,192

1

ml.p 5,48 x large

GPU H100

Ottimizzazione delle politiche prossimali

Modello

Numero di istanze del modello critico

Numero di istanze del modello Reward

Numero di istanze del modello Anchor

Actor Train

Generazione di attori

Numero di istanze

Ore totali per esecuzione

Ore P5

Tipo di istanza

Amazon NovaMicro

1

1

1

2

2

7

8

56

ml. p 5,48 x grande

Amazon Nova Lite

1

1

1

2

2

7

16

112

ml.p 5,48 x grande

Amazon Nova Pro

1

1

1

6

2

11

26

260

ml.p 5,48 x grande