

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Frameworks pris en charge et Régions AWS
<a name="distributed-model-parallel-support-v2"></a>

Avant d'utiliser la bibliothèque de parallélisme de SageMaker modèles v2 (SMP v2), vérifiez les frameworks et les types d'instances pris en charge et déterminez s'il existe suffisamment de quotas dans votre AWS compte et. Région AWS

**Note**  
Pour vérifier les dernières mises à jour et notes de mises à jour de la bibliothèque, consultez [Notes de mise à jour pour la bibliothèque de parallélisme des SageMaker modèles](model-parallel-release-notes.md).

## Cadres pris en charge
<a name="distributed-model-parallel-supported-frameworks-v2"></a>

SMP v2 prend en charge les cadres de deep learning suivants et est disponible via les conteneurs Docker SMP et un canal Conda SMP. Lorsque vous utilisez les classes d'estimateur du framework dans le SDK SageMaker Python et que vous spécifiez la configuration de distribution pour utiliser SMP v2, l' SageMaker IA récupère automatiquement les conteneurs SMP Docker. Pour utiliser SMP v2, nous vous recommandons de toujours mettre à jour le SDK SageMaker Python dans votre environnement de développement.

**PyTorch versions prises en charge par la SageMaker bibliothèque de parallélisme des modèles**



- **v2.5.1**
  - **SageMaker version de la bibliothèque de parallélisme des modèles:** smdistributed-modelparallel==v2.8.0
  - **URI d’image Docker SMP:** 658645717510.dkr.ecr.{{<us-west-2>}}.amazonaws.com/smdistributed-modelparallel:2.5.1-gpu-py311-cu124
  - **URI d’image:** https://sagemaker-distributed-model-parallel.s3.{{<us-west-2>}}.amazonaws.com/enroot/2.5.1-gpu-py311-cu124.sqsh

- **v2.4.1**
  - **SageMaker version de la bibliothèque de parallélisme des modèles:** smdistributed-modelparallel==v2.7.0 / **URI d’image:** https://sagemaker-distributed-model-parallel.s3.{{<us-west-2>}}.amazonaws.com/enroot/2.4.1-gpu-py311-cu121.sqsh
  - **SageMaker version de la bibliothèque de parallélisme des modèles:** smdistributed-modelparallel==v2.6.1 / **URI d’image:** N/A
  - **SageMaker version de la bibliothèque de parallélisme des modèles:** smdistributed-modelparallel==v2.6.0 / **URI d’image:** N/A
  - **URI d’image Docker SMP:** 658645717510.dkr.ecr.{{<us-west-2>}}.amazonaws.com/smdistributed-modelparallel:2.4.1-gpu-py311-cu121

- **v2.3.1**
  - **SageMaker version de la bibliothèque de parallélisme des modèles:**
    - smdistributed-modelparallel==v2.5.0
    - smdistributed-modelparallel==v2.4.0
  - **URI d’image Docker SMP:** 658645717510.dkr.ecr.{{us-west-2}}.amazonaws.com/smdistributed-modelparallel:2.3.1-gpu-py311-cu121
  - **URI d’image:** N/A

- **v2.2.0**
  - **SageMaker version de la bibliothèque de parallélisme des modèles:**
    - smdistributed-modelparallel==v2.3.0
    - smdistributed-modelparallel==v2.2.0
  - **URI d’image Docker SMP:** 658645717510.dkr.ecr.{{us-west-2}}.amazonaws.com/smdistributed-modelparallel:2.2.0-gpu-py310-cu121
  - **URI d’image:** N/A

- **v2.1.2**
  - **SageMaker version de la bibliothèque de parallélisme des modèles:** smdistributed-modelparallel==v2.1.0
  - **URI d’image Docker SMP:** 658645717510.dkr.ecr.{{us-west-2}}.amazonaws.com/smdistributed-modelparallel:2.1.2-gpu-py310-cu121
  - **URI d’image:** N/A

- **v2.0.1**
  - **SageMaker version de la bibliothèque de parallélisme des modèles:** smdistributed-modelparallel==v2.0.0
  - **URI d’image Docker SMP:** 658645717510.dkr.ecr.{{us-west-2}}.amazonaws.com/smdistributed-modelparallel:2.0.1-gpu-py310-cu121
  - **URI d’image:** N/A



**Canal Conda SMP**

Le compartiment Amazon S3 suivant est le canal Conda public hébergé par l’équipe du service SMP. Si vous souhaitez installer la bibliothèque SMP v2 dans un environnement tel que des SageMaker HyperPod clusters, utilisez ce canal Conda pour installer correctement la bibliothèque SMP.

```
https://sagemaker-distributed-model-parallel.s3.{{us-west-2}}.amazonaws.com/smp-v2/
```

Pour plus d’informations sur les canaux Conda en général, consultez [Channels](https://docs.conda.io/projects/conda/en/latest/user-guide/concepts/channels.html) dans la *documentation Conda*.

**Note**  
Pour trouver les versions précédentes de la bibliothèque SMP v1.x et les versions préemballées DLCs, consultez [Cadres pris en charge](distributed-model-parallel-support.md#distributed-model-parallel-supported-frameworks) la documentation *SMP* v1.

### Utilisation de SMP v2 avec des bibliothèques open source
<a name="distributed-model-parallel-supported-frameworks-v2-open-source"></a>

La bibliothèque SMP v2 fonctionne avec d'autres bibliothèques open PyTorch source telles que PyTorch Lightning, Hugging Face Transformers et Hugging Face Accelerate, car SMP v2 est compatible avec le FSDP. PyTorch APIs Si vous avez d’autres questions sur l’utilisation de la bibliothèque SMP avec d’autres bibliothèques tierces, contactez l’équipe du service SMP à l’adresse `sm-model-parallel-feedback@amazon.com`.

## Régions AWS
<a name="distributed-model-parallel-availablity-zone-v2"></a>

SMP v2 est disponible dans les versions suivantes Régions AWS. Si vous souhaitez utiliser l'image SMP Docker URIs ou le canal SMP Conda, consultez la liste suivante, choisissez celle qui Région AWS correspond à la vôtre, puis mettez à jour l'URI de l'image ou l'URL du canal en conséquence.
+ ap-northeast-1
+ ap-northeast-2
+ ap-northeast-3
+ ap-south-1
+ ap-southeast-1
+ ap-southeast-2
+ ca-central-1
+ eu-central-1
+ eu-north-1
+ eu-west-1
+ eu-west-2
+ eu-west-3
+ sa-east-1
+ us-east-1
+ us-east-2
+ us-west-1
+ us-west-2

## Types d’instance pris en charge
<a name="distributed-model-parallel-supported-instance-types-v2"></a>

SMP v2 requiert l’un des types d’instances de ML suivants.


| Type d’instance | 
| --- | 
| ml.p4d.24xlarge | 
| ml.p4de.24xlarge | 
| ml.p5.48xlarge | 
| ml.p5e.48xlarge | 

**Astuce**  
À partir de SMP v2.2.0, la prise en charge de la version PyTorch 2.2.0 et des versions ultérieures est disponible. [Entraînement de précision mixte avec des FP8 instances P5 à l'aide de Transformer Engine](model-parallel-core-features-v2-mixed-precision.md#model-parallel-core-features-v2-mixed-precision-fp8-training-on-p5)

Pour les spécifications des types d'instances d'apprentissage SageMaker automatique en général, consultez la section **Accelerated Computing** de la [page Types d'instances Amazon EC2](https://aws.amazon.com/ec2/instance-types/). Pour plus d'informations sur la tarification des instances, consultez [Amazon SageMaker AI Pricing](https://aws.amazon.com/sagemaker/pricing/).

Si vous rencontrez un message d’erreur semblable au suivant, suivez les instructions de la section [Demande d’augmentation de quota](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html) dans le *Guide de l’utilisateur AWS Service Quotas*.

```
ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling
    the CreateTrainingJob operation: The account-level service limit 'ml.p3dn.24xlarge
    for training job usage' is 0 Instances, with current utilization of 0 Instances
    and a request delta of 1 Instances.
    Please contact AWS support to request an increase for this limit.
```