Personnalisation d'Amazon Nova sur Amazon SageMaker HyperPod - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Personnalisation d'Amazon Nova sur Amazon SageMaker HyperPod

Vous pouvez personnaliser les modèles Amazon Nova à l'aide des recettes Amazon Nova et les entraîner sur Amazon SageMaker HyperPod. Une recette est un fichier de configuration YAML qui fournit des informations à l' SageMaker IA sur la manière d'exécuter votre tâche de personnalisation de modèle.

Amazon SageMaker HyperPod propose un calcul haute performance avec des instances GPU optimisées et Amazon FSx pour le stockage Lustre, une surveillance robuste grâce à l'intégration d'outils tels que TensorBoard la gestion flexible des points de contrôle pour une amélioration itérative, un déploiement fluide sur Amazon Bedrock à des fins d'inférence et une formation distribuée multi-nœuds efficace et évolutive, le tout fonctionnant ensemble pour fournir aux entreprises un environnement sécurisé, performant et flexible leur permettant d'adapter les modèles Nova à leurs besoins commerciaux spécifiques.

La personnalisation d'Amazon Nova sur Amazon SageMaker HyperPod stocke les artefacts du modèle, y compris les points de contrôle du modèle, dans un compartiment Amazon S3 géré par des services. Les artefacts du compartiment géré par les services sont chiffrés à l'aide de clés gérées par des SageMaker services. AWS KMS Les compartiments Amazon S3 gérés par des services ne prennent actuellement pas en charge le chiffrement des données à l'aide de clés KMS gérées par le client. Vous pouvez utiliser cet emplacement de point de contrôle pour des tâches d'évaluation ou des inférences sur Amazon Bedrock.

La tarification standard peut s'appliquer aux instances de calcul, au stockage Amazon S3 et FSx à Lustre. Pour plus de détails sur les SageMaker HyperPod tarifs, consultez les tarifs, les tarifs Amazon S3 et FSx les tarifs Lustre.

Exigences en matière de calcul

Les tableaux suivants résument les exigences informatiques pour la SageMaker HyperPod formation.

Pré-entraînement

Modèle

Durée de la séquence

Nœuds

Instance

Accélérateur

Amazon Nova Micro

8 192

8

ml.p 5,48 x large

GPU H100

Amazon Nova Lite

8 192

16

ml.p 5,48 x large

GPU H100

Amazon Nova Pro

8 192

24

ml.p 5,48 x large

GPU H100

Optimisation directe des préférences (DPO)

Modèle

Durée de la séquence

Nombre de modèles

Instance

Accélérateur

Optimisation directe des préférences (complète)

32 768

2, 4 ou 6

ml.p 5,48 x large

GPU H100

Optimisation directe des préférences (LoRa)

32 768

2, 4 ou 6

ml.p 5,48 x large

GPU H100

Affinement

Modèle

Durée de la séquence

Nombre de modèles

Instance

Accélérateur

Réglage fin supervisé (LoRa)

65 536

2

ml.p 5,48 x large

GPU H100

Réglage précis supervisé (complet)

65 536

2

ml.p 5,48 x large

GPU H100

Réglage fin supervisé (LoRa)

32 768

4

ml.p 5,48 x large

GPU H100

Réglage précis supervisé (complet)

65 536

4

ml.p 5,48 x large

GPU H100

Réglage fin supervisé (LoRa)

65 536

6

ml.p 5,48 x large

GPU H100

Réglage précis supervisé (complet)

65 536

6

ml.p 5,48 x large

GPU H100

Distillation

Modèle

Nœuds

Instance

Distillation modélisée pour la post-formation

1

ml.r5.24xlarge

Evaluation

Modèle

Durée de la séquence

Nœuds

Instance

Accélérateur

Recette de référence textuelle générale

8 192

1

ml.p 5,48 x large

GPU H100

Recette de référence avec votre propre jeu de données (gen_qa)

8 192

1

ml.p 5,48 x large

GPU H100

Amazon Nova LLM comme recette de juge

8 192

1

ml.p 5,48 x large

GPU H100

Benchmarks de texte standard

8 192

1

ml.p 5,48 x large

GPU H100

Évaluation de l'ensemble de données personnalisé

8 192

1

ml.p 5,48 x large

GPU H100

Points de référence multimodaux

8 192

1

ml.p 5,48 x large

GPU H100

Optimisation des politiques proximales

Modèle

Nombre d'instances du modèle critique

Nombre d'instances du modèle Reward

Nombre d'instances du modèle d'ancrage

Train de comédiens

Génération d'acteurs

Nombre d'instances

Nombre total d'heures par course

Heures P5

Type d'instance

Amazon Nova Micro

1

1

1

2

2

7

8

56

ml.p 5,48 x large

Amazon Nova Lite

1

1

1

2

2

7

16

112

ml.p 5,48 x large

Amazon Nova Pro

1

1

1

6

2

11

26

260

ml.p 5,48 x large