Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Personnalisation d'Amazon Nova sur SageMaker HyperPod
Vous pouvez personnaliser les modèles Amazon Nova, y compris les modèles Nova 2.0 améliorés, à l'aide des recettes Amazon Nova et les entraîner sur Hyperpod. Une recette est un fichier de configuration YAML qui fournit des informations à l' SageMaker IA sur la manière d'exécuter votre tâche de personnalisation de modèle. SageMaker HyperPod prend en charge deux types de services : Forge et non-Forge.
Hyperpod propose un calcul haute performance avec des instances GPU optimisées et un stockage Amazon FSx for Lustre, une surveillance robuste grâce à l'intégration d'outils tels que TensorBoard la gestion flexible des points de contrôle pour une amélioration itérative, un déploiement fluide sur Amazon Bedrock à des fins d'inférence et une formation distribuée multinœuds efficace et évolutive, le tout fonctionnant ensemble pour fournir aux entreprises un environnement sécurisé, performant et flexible leur permettant d'adapter les modèles Nova à leurs besoins commerciaux spécifiques.
La personnalisation d'Amazon Nova permet de SageMaker HyperPod stocker les artefacts du modèle, y compris les points de contrôle du modèle, dans un compartiment Amazon S3 géré par des services. Les artefacts du compartiment géré par les services sont chiffrés à l'aide de clés gérées par l' SageMaker IA AWS KMS . Les compartiments Amazon S3 gérés par service ne prennent actuellement pas en charge le chiffrement des données à l’aide de clés KMS gérées par le client. Vous pouvez utiliser cet emplacement de point de contrôle pour les tâches d’évaluation ou l’inférence Amazon Bedrock.
La tarification standard peut s'appliquer aux instances de calcul, au stockage Amazon S3 et FSx à Lustre. Pour plus de détails sur les tarifs, consultez la tarification d'Hyperpod
Exigences de calcul pour les modèles Amazon Nova 1
Les tableaux suivants résument les exigences informatiques et la formation aux métiers de formation en SageMaker IA pour les modèles Nova 1.0.
Modèle |
Durée de la séquence |
Nœuds |
Instance |
Accélérateur |
|---|---|---|---|---|
Amazon Nova Micro |
8 192 |
8 |
ml.p5.48xlarge |
GPU H100 |
Amazon Nova Lite |
8 192 |
16 |
ml.p5.48xlarge |
GPU H100 |
Amazon Nova Pro |
8 192 |
12 |
ml.p5.48xlarge |
GPU H100 |
Modèle |
Durée de la séquence |
Nombre de modèles |
Instance |
Accélérateur |
|---|---|---|---|---|
Optimisation directe des préférences (complète) |
32 768 |
2, 4 ou 6 |
ml.p5.48xlarge |
GPU H100 |
Optimisation directe des préférences (LoRA) |
32 768 |
2, 4 ou 6 |
ml.p5.48xlarge |
GPU H100 |
Modèle |
Technique |
Durée de la séquence |
Nombre de modèles |
Instance |
Accélérateur |
|---|---|---|---|---|---|
| Amazon Nova 1 Micro |
Peaufinage supervisé (LoRA) |
65 536 |
2 |
ml.p5.48xlarge |
GPU H100 |
| Amazon Nova 1 Micro |
Peaufinage supervisé (complet) |
65 536 |
2 |
ml.p5.48xlarge |
GPU H100 |
| Amazon Nova 1 Lite |
Peaufinage supervisé (LoRA) |
32 768 |
4 |
ml.p5.48xlarge |
GPU H100 |
| Amazon Nova 1 Lite |
Peaufinage supervisé (complet) |
65 536 |
4 |
ml.p5.48xlarge |
GPU H100 |
| Amazon Nova 1 Pro |
Peaufinage supervisé (LoRA) |
65 536 |
6 |
ml.p5.48xlarge |
GPU H100 |
| Amazon Nova 1 Pro |
Peaufinage supervisé (complet) |
65 536 |
6 |
ml.p5.48xlarge |
GPU H100 |
Modèle |
Nœuds |
Instance |
|---|---|---|
Distillation de modèles pour post-entraînement |
1 |
ml.r5.24xlarge |
Modèle |
Durée de la séquence |
Nœuds |
Instance |
Accélérateur |
|---|---|---|---|---|
Formule de point de référence de texte général |
8 192 |
1 |
ml.p5.48xlarge |
GPU H100 |
Apportez votre propre formule de point de référence de jeu de données (gen_qa) |
8 192 |
1 |
ml.p5.48xlarge |
GPU H100 |
Formule Amazon Nova LLM-juge |
8 192 |
1 |
ml.p5.48xlarge |
GPU H100 |
Points de référence de texte standard |
8 192 |
1 |
ml.p5.48xlarge |
GPU H100 |
Évaluation de jeu de données personnalisé |
8 192 |
1 |
ml.p5.48xlarge |
GPU H100 |
Points de référence multimodaux |
8 192 |
1 |
ml.p5.48xlarge |
GPU H100 |
Modèle |
Nombre d’instances du modèle critique |
Nombre d’instances du modèle récompense |
Nombre d’instances du modèle ancrage |
Entraînement des modèles acteurs |
Génération de modèle acteur |
Nombre d’instances |
Nombre total d’heures par exécution |
Heures P5 |
Type d'instance |
|---|---|---|---|---|---|---|---|---|---|
Amazon Nova Micro |
1 |
1 |
1 |
2 |
2 |
7 |
8 |
56 |
ml.p5.48xlarge |
Amazon Nova Lite |
1 |
1 |
1 |
2 |
2 |
7 |
16 |
112 |
ml.p5.48xlarge |
Amazon Nova Pro |
1 |
1 |
1 |
6 |
2 |
11 |
26 |
260 |
ml.p5.48xlarge |