

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Marcos Regiones de AWS, tipos de instancias y modelos probados compatibles
<a name="training-compiler-support"></a>

**importante**  
Amazon Web Services (AWS) anuncia que no habrá nuevas versiones o versiones de SageMaker Training Compiler. Puede seguir utilizando SageMaker Training Compiler a través de los AWS Deep Learning Containers (DLCs) existentes para SageMaker formación. Es importante tener en cuenta que, si bien los existentes DLCs permanecen accesibles, ya no recibirán parches ni actualizaciones de ellos AWS, de acuerdo con la [Política de soporte de AWS Deep Learning Containers Framework](https://docs.aws.amazon.com/deep-learning-containers/latest/devguide/support-policy.html).

Antes de utilizar SageMaker Training Compiler, compruebe si el marco que ha elegido es compatible, si los tipos de instancia están disponibles en el suyo y si el suyo Cuenta de AWS es compatible Regiones de AWS. Cuenta de AWS

**nota**  
SageMaker El compilador de entrenamiento está disponible en la versión 2.70.0 o posterior del SDK de SageMaker Python.

## Marcos admitidos
<a name="training-compiler-supported-frameworks"></a>

SageMaker Training Compiler es compatible con los siguientes marcos de aprendizaje profundo y está disponible a través de AWS Deep Learning Containers.

**Topics**
+ [PyTorch](#training-compiler-supported-frameworks-pytorch)
+ [TensorFlow](#training-compiler-supported-frameworks-tensorflow)

### PyTorch
<a name="training-compiler-supported-frameworks-pytorch"></a>



- **PyTorch**
  - **Versión de marco:** PyTorch v1.13.1 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/:1.12.0-gpu-py38-cu113-ubuntu20.04-sagemaker pytorch-trcomp-training / **Ampliable para personalización de Docker:** No
  - **Versión de marco:** PyTorch v1.12.0 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/:1.13.1-gpu-py39-cu117-ubuntu20.04-sagemaker pytorch-trcomp-training / **Ampliable para personalización de Docker:** No

- **PyTorch con Hugging Face Transformers**
  - **Versión de marco:** Transformers v4.21.1<br />PyTorch v1.11.0 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/:1.11.0-transformers4.21.1-gpu-py38-cu113-ubuntu20.04 huggingface-pytorch-trcomp-training / **Ampliable para personalización de Docker:** No
  - **Versión de marco:** Transformers v4.17.0<br />PyTorch v1.10.2 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/:1.10.2-transformers4.17.0-gpu-py38-cu113-ubuntu20.04 huggingface-pytorch-trcomp-training / **Ampliable para personalización de Docker:** No
  - **Versión de marco:** Transformers v4.11.0<br />PyTorch v1.9.0 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/:1.9.0-transformers4.11.0-gpu-py38-cu111-ubuntu20.04 huggingface-pytorch-training-comp / **Ampliable para personalización de Docker:** No



### TensorFlow
<a name="training-compiler-supported-frameworks-tensorflow"></a>



- **TensorFlow**
  - **Versión de marco:** TensorFlow v2.11.0 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/tensorflow-training:2.11.0-gpu-py39-cu112-ubuntu20.04-sagemaker / **Ampliable para personalización de Docker:** Sí
  - **Versión de marco:** TensorFlow v2.10.0 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/tensorflow-training:2.10.0-gpu-py39-cu112-ubuntu20.04-sagemaker / **Ampliable para personalización de Docker:** Sí
  - **Versión de marco:** TensorFlow v2.9.1 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/tensorflow-training:2.9.1-gpu-py39-cu112-ubuntu20.04-sagemaker / **Ampliable para personalización de Docker:** Sí

- **TensorFlow con Hugging Face Transformers**
  - **Versión de marco:** Transformers v4.17.0<br />TensorFlow v2.6.3 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/:2.6.3-transformers4.17.0-gpu-py38-cu112-ubuntu20.04 huggingface-tensorflow-trcomp-training / **Ampliable para personalización de Docker:** No
  - **Versión de marco:** Transformers v4.11.0<br />TensorFlow v2.5.1 / **URI de contenedor de aprendizaje profundo:** 763104351884.dkr.ecr. {{<region>}}.amazonaws.com/:2.5.1-transformers4.11.0-gpu-py37-cu112-ubuntu18.04 huggingface-tensorflow-training-comp / **Ampliable para personalización de Docker:** No



Para obtener más información, consulte [Imágenes disponibles](https://github.com/aws/deep-learning-containers/blob/master/available_images.md) en el * GitHub repositorio de AWS Deep Learning Containers*.

## Regiones de AWS
<a name="training-compiler-availablity-zone"></a>

Los [contenedores SageMaker Training Compiler](https://github.com/aws/deep-learning-containers/blob/master/available_images.md#sagemaker-training-compiler-containers) están disponibles en los Regiones de AWS lugares en los que [AWS Deep Learning Containers](https://github.com/aws/deep-learning-containers/blob/master/available_images.md) están en servicio, excepto en las regiones de China.

## Tipos de instancias admitidos
<a name="training-compiler-supported-instance-types"></a>

SageMaker Training Compiler se ha probado en los siguientes tipos de instancias de aprendizaje automático y es compatible con ellos.
+ Instancias P4
+ Instancias P3
+ Instancias G4dn
+ instancias G5

Para ver las especificaciones de los tipos de instancias, consulte la sección **Computación acelerada** en la [página de tipos de instancias de Amazon EC2](https://aws.amazon.com/ec2/instance-types/). Para obtener información sobre los precios de las instancias, consulta [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/).

Si te aparece un mensaje de error similar al siguiente, sigue las instrucciones que se indican en [Solicitar un aumento de la cuota de servicio para los recursos de SageMaker IA](https://docs.aws.amazon.com/sagemaker/latest/dg/regions-quotas.html#service-limit-increase-request-procedure).

```
ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling
the CreateTrainingJob operation: The account-level service limit 'ml.p3dn.24xlarge
for training job usage' is 0 Instances, with current utilization of 0 Instances
and a request delta of 1 Instances.
Please contact AWS support to request an increase for this limit.
```

## Modelos probados
<a name="training-compiler-tested-models"></a>

La siguiente tabla incluye una lista de los modelos que se han probado con SageMaker Training Compiler. Como referencia, el tamaño de lote más grande que cabe en la memoria también se incluye junto con otros parámetros de entrenamiento. SageMaker Training Compiler puede cambiar el tamaño de memoria del proceso de entrenamiento del modelo; como resultado, a menudo se puede utilizar un tamaño de lote mayor durante el proceso de entrenamiento, lo que reduce aún más el tiempo total de entrenamiento. En algunos casos, SageMaker Training Compiler promueve el almacenamiento en caché de forma inteligente, lo que reduce el tamaño de lote más grande que cabe en la GPU. Debe volver a ajustar los hiperparámetros del modelo y encontrar un tamaño de lote óptimo para su caso. Para ahorrar tiempo, utilice las siguientes tablas de referencia para buscar un tamaño de lote que pueda ser un buen punto de partida para su caso de uso.

**nota**  
Los tamaños de lote son tamaños de lotes locales que caben en cada GPU individual del tipo de instancia respectivo. También debe ajustar la tasa de entrenamiento al cambiar el tamaño del lote.

### PyTorch 1.13.1
<a name="training-compiler-tested-models-pt1131"></a>

**Modelos de procesamiento de lenguaje natural (NLP)**

Los siguientes modelos se han probado para tareas de entrenamiento con todas las combinaciones de uno y varios nodos con uno o varios núcleos de GPU y precisión mixta automática (AMP), como se indica.

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

**Modelos de visión artificial (CV)**

Las pruebas se realizaron con [TensorFlowModel Garden](https://github.com/tensorflow/models) con precisión mixta automática (AMP), tal y como se indica.

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

### PyTorch 1.12.0
<a name="training-compiler-tested-models-pt1120"></a>

**Modelos de procesamiento de lenguaje natural (NLP)**

Los siguientes modelos se han probado para tareas de entrenamiento con todas las combinaciones de uno y varios nodos con uno o varios núcleos de GPU y precisión mixta automática (AMP), como se indica.

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

### TensorFlow 2.11.0
<a name="training-compiler-tested-models-tf2110"></a>

**Modelos de visión artificial (CV)**

Las pruebas se realizaron con [TensorFlowModel Garden](https://github.com/tensorflow/models) con precisión mixta automática (AMP), tal y como se indica.

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

**Modelos de procesamiento de lenguaje natural (NLP)**

Las pruebas se realizaron con [modelos de Trasnformer](https://github.com/huggingface/transformers) con `Sequence_Len=128` y precisión mixta automática (AMP), como se indica.

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

### TensorFlow 2.10.0
<a name="training-compiler-tested-models-tf2100"></a>

**Modelos de visión artificial (CV)**

Las pruebas se realizaron con [TensorFlowModel Garden](https://github.com/tensorflow/models) con precisión mixta automática (AMP), tal y como se indica.

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

**Modelos de procesamiento de lenguaje natural (NLP)**

Las pruebas se realizaron con [modelos de Trasnformer](https://github.com/huggingface/transformers) con `Sequence_Len=128` y precisión mixta automática (AMP), como se indica.

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

### TensorFlow 2.9.1
<a name="training-compiler-tested-models-tf291"></a>

Probado con [TensorFlowModel Garden](https://github.com/tensorflow/models) con precisión mixta automática (AMP).

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

\* Los tamaños de lote marcados con el símbolo de asterisco (\*) indican el tamaño de lote más grande probado por el equipo de desarrolladores de Training Compiler. SageMaker En el caso de las celdas marcadas, es posible que la instancia pueda adaptarse a un tamaño de lote mayor al indicado.

### Transformers 4.21.1 con 1.11.0 PyTorch
<a name="training-compiler-tested-models-hf421-pt111"></a>

Probados con `Sequence_Len=512` y precisión mixta automática (AMP).

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

### Transformers 4.17.0 con 1.10.2 PyTorch
<a name="training-compiler-tested-models-hf417-pt110"></a>

Probados con `Sequence_Len=512` y precisión mixta automática (AMP).

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

### Transformers 4.11.0 con 1.9.0 PyTorch
<a name="training-compiler-tested-models-hf411-pt190"></a>

Probados con `Sequence_Len=512` y precisión mixta automática (AMP).

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)

### Transformers 4.17.0 con 2.6.3 TensorFlow
<a name="training-compiler-tested-models-hf417-tf263"></a>

Probados con `Sequence_Len=128` y precisión mixta automática (AMP).


| Modelo  | Tipo de instancia | Tamaño de lote para marcos nativos | Tamaño de lote para el Compilador de entrenamiento | 
| --- | --- | --- | --- | 
| albert-base-v2. | ml.g4dn.16xlarge | 136 | 208 | 
| albert-base-v2. | ml.g5.4xlarge | 219 | 312 | 
| albert-base-v2. | ml.p3.2xlarge | 152 | 208 | 
| albert-base-v2. | ml.p3.8xlarge | 152 | 192 | 
| bert-base-uncased | ml.g4dn.16xlarge | 120 | 101 | 
| bert-base-uncased | ml.g5.4xlarge | 184 | 160 | 
| bert-base-uncased | ml.p3.2xlarge | 128 | 108 | 
| bert-large-uncased | ml.g4dn.16xlarge | 37 | 28 | 
| bert-large-uncased | ml.g5.4xlarge | 64 | 55 | 
| bert-large-uncased | ml.p3.2xlarge | 40 | 32 | 
| camembert-base | ml.g4dn.16xlarge | 96 | 100 | 
| camembert-base | ml.g5.4xlarge | 190 | 160 | 
| camembert-base | ml.p3.2xlarge | 129 | 108 | 
| camembert-base | ml.p3.8xlarge | 128 | 104 | 
| distilbert-base-uncased | ml.g4dn.16xlarge | 210 | 160 | 
| distilbert-base-uncased | ml.g5.4xlarge | 327 | 288 | 
| distilbert-base-uncased | ml.p3.2xlarge | 224 | 196 | 
| distilbert-base-uncased | ml.p3.8xlarge | 192 | 182 | 
| google\_ electra-small-discriminator | ml.g4dn.16xlarge | 336 | 288 | 
| google\_ electra-small-discriminator | ml.g5.4xlarge | 504 | 384 | 
| google\_ electra-small-discriminator | ml.p3.2xlarge | 352 | 323 | 
| gpt2 | ml.g4dn.16xlarge | 89 | 64 | 
| gpt2 | ml.g5.4xlarge | 140 | 146 | 
| gpt2 | ml.p3.2xlarge | 94 | 96 | 
| gpt2 | ml.p3.8xlarge | 96 | 88 | 
| jplu\_ tf-xlm-roberta-base | ml.g4dn.16xlarge | 52 | 16 | 
| jplu\_ tf-xlm-roberta-base | ml.g5.4xlarge | 64 | 44 | 
| microsoft\_mpnet-base | ml.g4dn.16xlarge | 120 | 100 | 
| microsoft\_mpnet-base | ml.g5.4xlarge | 192 | 160 | 
| microsoft\_mpnet-base | ml.p3.2xlarge | 128 | 104 | 
| microsoft\_mpnet-base | ml.p3.8xlarge | 130 | 92 | 
| roberta-base | ml.g4dn.16xlarge | 108 | 64 | 
| roberta-base | ml.g5.4xlarge | 176 | 142 | 
| roberta-base | ml.p3.2xlarge | 118 | 100 | 
| roberta-base | ml.p3.8xlarge | 112 | 88 | 

### Transformers 4.11.0 con 2.5.1 TensorFlow
<a name="training-compiler-tested-models-hf411-tf251"></a>

Probados con `Sequence_Len=128` y precisión mixta automática (AMP).

[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/training-compiler-support.html)