As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá. # Estruturas suportadas Regiões da AWS, tipos de instância e modelos testados **Importante** A Amazon Web Services (AWS) anuncia que não haverá novos lançamentos ou versões do SageMaker Training Compiler. Você pode continuar a utilizar o SageMaker Training Compiler por meio dos AWS Deep Learning Containers (DLCs) existentes para SageMaker treinamento. É importante observar que, embora os existentes DLCs permaneçam acessíveis, eles não receberão mais patches ou atualizações de AWS, de acordo com a [Política de Suporte do AWS Deep Learning Containers Framework](https://docs.aws.amazon.com/deep-learning-containers/latest/devguide/support-policy.html). Antes de usar o SageMaker Training Compiler, verifique se sua estrutura preferida é compatível, se os tipos de instância estão disponíveis na sua Conta da AWS e se a sua Conta da AWS está em uma das suportadas Regiões da AWS. **nota** SageMaker O Training Compiler está disponível no SageMaker Python SDK v2.70.0 ou posterior. ## Estruturas compatíveis SageMaker O Training Compiler oferece suporte às seguintes estruturas de aprendizado profundo e está disponível por meio do AWS Deep Learning Containers. **Topics** + [PyTorch](#training-compiler-supported-frameworks-pytorch) + [TensorFlow](#training-compiler-supported-frameworks-tensorflow) ### PyTorch - **PyTorch** - **Versão do framework:** PyTorch v1.13.1 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/:1.12.0-gpu-py38-cu113-ubuntu20.04-sagemaker pytorch-trcomp-training / **Extensível para personalização do Docker:** Não - **Versão do framework:** PyTorch v1.12.0 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/:1.13.1-gpu-py39-cu117-ubuntu20.04-sagemaker pytorch-trcomp-training / **Extensível para personalização do Docker:** Não - **PyTorch com Hugging Face Transformers** - **Versão do framework:** Transformadores v4.21.1
PyTorch v1.11.0 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/:1.11.0-transformers4.21.1-gpu-py38-cu113-ubuntu20.04 huggingface-pytorch-trcomp-training / **Extensível para personalização do Docker:** Não - **Versão do framework:** Transformadores v4.17.0
PyTorch v1.10.2 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/:1.10.2-transformers4.17.0-gpu-py38-cu113-ubuntu20.04 huggingface-pytorch-trcomp-training / **Extensível para personalização do Docker:** Não - **Versão do framework:** Transformadores v4.11.0
PyTorch v1.9.0 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/:1.9.0-transformers4.11.0-gpu-py38-cu111-ubuntu20.04 huggingface-pytorch-training-comp / **Extensível para personalização do Docker:** Não ### TensorFlow - **TensorFlow** - **Versão do framework:** TensorFlow v2.11.0 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/tensorflow-training:2.11.0-gpu-py39-cu112-ubuntu20.04-sagemaker / **Extensível para personalização do Docker:** Sim - **Versão do framework:** TensorFlow v2.10.0 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/tensorflow-training:2.10.0-gpu-py39-cu112-ubuntu20.04-sagemaker / **Extensível para personalização do Docker:** Sim - **Versão do framework:** TensorFlow v2.9.1 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/tensorflow-training:2.9.1-gpu-py39-cu112-ubuntu20.04-sagemaker / **Extensível para personalização do Docker:** Sim - **TensorFlow com Hugging Face Transformers** - **Versão do framework:** Transformadores v4.17.0
TensorFlow v2.6.3 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}.amazonaws.com/:2.6.3-transformers4.17.0-gpu-py38-cu112-ubuntu20.04 huggingface-tensorflow-trcomp-training / **Extensível para personalização do Docker:** Não - **Versão do framework:** Transformadores v4.11.0
TensorFlow v2.5.1 / **Contêineres de aprendizado profundo:** 763104351884.dkr.ecr. {{}}huggingface-tensorflow-training-comp.amazonaws.com/:2.5.1-transformers4.11.0-gpu-py37-cu112-ubuntu18.04 / **Extensível para personalização do Docker:** Não Para obter mais informações, consulte [Imagens disponíveis](https://github.com/aws/deep-learning-containers/blob/master/available_images.md) no * GitHub repositório AWS Deep Learning Containers*. ## Regiões da AWS Os [SageMaker Training Compiler Containers](https://github.com/aws/deep-learning-containers/blob/master/available_images.md#sagemaker-training-compiler-containers) estão disponíveis Regiões da AWS onde os [AWS Deep Learning Containers](https://github.com/aws/deep-learning-containers/blob/master/available_images.md) estão em serviço, exceto nas regiões da China. ## Tipos de instâncias compatíveis SageMaker O Training Compiler foi testado e é compatível com os seguintes tipos de instância de ML. + Instâncias P4 + Instâncias P3 + Instâncias G4dn + Instâncias G5 Para especificações dos tipos de instância, consulte a seção **Computação acelerada** na [página Tipos de instância do Amazon EC2](https://aws.amazon.com/ec2/instance-types/). Para obter informações sobre preços de instâncias, consulte [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/). Se você encontrou uma mensagem de erro semelhante à seguinte, siga as instruções em [Solicitar um aumento da cota de serviço para recursos de SageMaker IA](https://docs.aws.amazon.com/sagemaker/latest/dg/regions-quotas.html#service-limit-increase-request-procedure). ``` ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateTrainingJob operation: The account-level service limit 'ml.p3dn.24xlarge for training job usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. Please contact AWS support to request an increase for this limit. ``` ## Modelos testados A tabela a seguir inclui uma lista dos modelos que foram testados com o SageMaker Training Compiler. Para referência, o maior tamanho de lote que pode caber na memória também está incluído junto com outros parâmetros de treinamento. SageMaker O Training Compiler pode alterar a pegada de memória do processo de treinamento do modelo; como resultado, um lote maior geralmente pode ser usado durante o processo de treinamento, diminuindo ainda mais o tempo total de treinamento. Em alguns casos, o SageMaker Training Compiler promove o armazenamento em cache de forma inteligente, o que leva a uma diminuição no maior tamanho do lote que cabe na GPU. Você precisa reajustar os hiperparâmetros do seu modelo e encontrar um tamanho de lote (batch size) ideal para o seu caso. Para economizar tempo, use as tabelas de referência a seguir para pesquisar um tamanho de lote que pode ser um bom ponto de partida para seu caso de uso. **nota** Os tamanhos dos lotes são tamanhos de lote locais que cabem em cada GPU individual no respectivo tipo de instância. Você também deve ajustar a taxa de aprendizado ao alterar o tamanho do lote. ### PyTorch 1.13.1 **Modelos de processamento de linguagem natural (PLN)** Os modelos a seguir são testados para trabalhos de treinamento para todas as combinações de nó único e vários nós com núcleos de GPU únicas ou várias e precisão mista automática (AMP), conforme indicado.

GPU node/multi-node single-GPU/multi única
Modelo	Conjunto de dados	Tipo de instância	Precisão	Comprimento da sequência	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
albert-base-v2	wikitext-2-raw-v1	g4dn.16xlarge	float16	128	80	192
albert-base-v2	wikitext-2-raw-v1	g5.4xlarge	float16	128	128	332
albert-base-v2	wikitext-2-raw-v1	p3.2xlarge	float16	128	80	224
bert-base-uncased	wikitext-2-raw-v1	g5.4xlarge	float16	128	160	288
camembert-base	wikitext-2-raw-v1	g5.4xlarge	float16	128	160	280
distilbert-base-uncased	wikitext-2-raw-v1	g5.4xlarge	float16	128	240	472
distil2	wikitext-2-raw-v1	g4dn.16xlarge	float16	128	77	128
distil2	wikitext-2-raw-v1	g5.4xlarge	float16	128	138	390
distil2	wikitext-2-raw-v1	p3.2xlarge	float16	128	96	256
distilroberta-base	wikitext-2-raw-v1	g4dn.16xlarge	float16	128	96	192
distilroberta-base	wikitext-2-raw-v1	g5.4xlarge	float16	128	171	380
distilroberta-base	wikitext-2-raw-v1	p3.2xlarge	float16	128	112	256
gpt2	wikitext-2-raw-v1	g4dn.16xlarge	float16	128	52	152
gpt2	wikitext-2-raw-v1	g5.4xlarge	float16	128	84	240
gpt2	wikitext-2-raw-v1	p3.2xlarge	float16	128	58	164
microsoft/deberta-base	wikitext-2-raw-v1	g4dn.16xlarge	float16	128	48	128
microsoft/deberta-base	wikitext-2-raw-v1	g5.4xlarge	float16	128	84	207
microsoft/deberta-base	wikitext-2-raw-v1	p3.2xlarge	float16	128	53	133
roberta-base	wikitext-2-raw-v1	g5.4xlarge	float16	128	125	224
xlm-roberta-base	wikitext-2-raw-v1	g4dn.16xlarge	float16	128	16	31
xlm-roberta-base	wikitext-2-raw-v1	p3.2xlarge	float16	128	18	50
xlnet-base-cased	wikitext-2-raw-v1	g5.4xlarge	float16	128	128	240
bert-base-uncased	wikitext-103-v1	g5.48xlarge	float16	512	29	50
distilbert-base-uncased	wikitext-103-v1	g5.48xlarge	float16	512	45	64
gpt2	wikitext-103-v1	g5.48xlarge	float16	512	18	45
roberta-base	wikitext-103-v1	g5.48xlarge	float16	512	23	44
gpt2	wikitext-103-v1	p4d.24xlarge	float16	512	36	64

**Modelos de visão computacional (CV)** Testado usando o [TensorFlowModel Garden](https://github.com/tensorflow/models) com precisão mista automática (AMP), conforme indicado.

Single/multi-node single/multi-GPU
Modelo	Conjunto de dados	Tipo de instância	Precisão	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
ResNet152	food101	g4dn.16xlarge	float16	128	144
ResNet152	food101	g5.4xlarge	float16	128	192
ResNet152	food101	p3.2xlarge	float16	152	156
ViT	food101	g4dn.16xlarge	float16	512	512
ViT	food101	g5.4xlarge	float16	992	768
ViT	food101	p3.2xlarge	float16	848	768

### PyTorch 1.12.0 **Modelos de processamento de linguagem natural (PLN)** Os modelos a seguir são testados para trabalhos de treinamento para todas as combinações de nó único e vários nós com núcleos de GPU únicas ou várias e precisão mista automática (AMP), conforme indicado.

GPU node/multi-node single-GPU/multi única
Modelo	Conjunto de dados	Tipo de instância	Precisão	Comprimento da sequência	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
albert-base-v2	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	128	248
bert-base-uncased	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	160	288
camembert-base	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	160	279
camembert-base	wikitext-2-raw-v1	ml.p3.2xlarge	float16	128	105	164
distil2	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	136	256
distil2	wikitext-2-raw-v1	ml.p3.2xlarge	float16	128	80	118
gpt2	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	84	240
gpt2	wikitext-2-raw-v1	ml.p3.2xlarge	float16	128	80	119
microsoft/deberta-base	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	93	197
microsoft/deberta-base	wikitext-2-raw-v1	ml.p3.2xlarge	float16	128	113	130
roberta-base	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	125	224
roberta-base	wikitext-2-raw-v1	ml.p3.2xlarge	float16	128	78	112
xlnet-base-cased	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	138	240
bert-base-uncased	wikitext-103-v1	ml.p4d.24xlarge	float16	512		52
distilbert-base-uncased	wikitext-103-v1	ml.p4d.24xlarge	float16	512		160
gpt2	wikitext-103-v1	ml.p4d.24xlarge	float16	512		25
roberta-base	wikitext-103-v1	ml.p4d.24xlarge	float16	512		64

### TensorFlow 2.11.0 **Modelos de visão computacional (CV)** Testado usando o [TensorFlowModel Garden](https://github.com/tensorflow/models) com precisão mista automática (AMP), conforme indicado.

Single/multi-node single/multi-GPU
Modelo	Conjunto de dados	Tipo de instância	Precisão	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
Máscara RCNN - 50-FPN ResNet	COCO-2017	ml.g5.2xlarge	float16	6	8
Máscara RCNN - 50-FPN ResNet	COCO-2017	ml.p3.2xlarge	float16	4	6
ResNet50	ImageNet	ml.g5.2xlarge	float16	192	256
ResNet50	ImageNet	ml.p3.2xlarge	float16	256	256
ResNet101	ImageNet	ml.g5.2xlarge	float16	128	256
ResNet101	ImageNet	ml.p3.2xlarge	float16	128	128
ResNet152	ImageNet	ml.g5.2xlarge	float16	128	224
ResNet152	ImageNet	ml.p3.2xlarge	float16	128	128
VisionTransformer	ImageNet	ml.g5.2xlarge	float16	112	144
VisionTransformer	ImageNet	ml.p3.2xlarge	float16	96	128

**Modelos de processamento de linguagem natural (PLN)** Testado usando [modelos Transformadores](https://github.com/huggingface/transformers) com `Sequence_Len=128` e Precisão Mista Automática (AMP), conforme indicado.

Single/multi-node single/multi-GPU
Modelo	Conjunto de dados	Tipo de instância	Precisão	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
albert-base-v2	wikitext-2-raw-v1	ml.g5.2xlarge	float16	160	197
albert-base-v2	wikitext-2-raw-v1	ml.p3.2xlarge	float16	95	127
bert-base-uncased	wikitext-2-raw-v1	ml.g5.2xlarge	float16	160	128
bert-base-uncased	wikitext-2-raw-v1	ml.p3.2xlarge	float16	104	111
bert-large-uncased	wikitext-2-raw-v1	ml.g5.2xlarge	float16	65	48
bert-large-uncased	wikitext-2-raw-v1	ml.p3.2xlarge	float16	40	35
camembert-base	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	162
camembert-base	wikitext-2-raw-v1	ml.p3.2xlarge	float16	105	111
distilbert-base-uncased	wikitext-2-raw-v1	ml.g5.2xlarge	float16	256	264
distilbert-base-uncased	wikitext-2-raw-v1	ml.p3.2xlarge	float16	128	169
gpt2	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	120
gpt2	wikitext-2-raw-v1	ml.p3.2xlarge	float16	80	83
jplu/ tf-xlm-roberta-base	wikitext-2-raw-v1	ml.g5.2xlarge	float16	32	32
jplu/ tf-xlm-roberta-base	wikitext-2-raw-v1	ml.p3.2xlarge	float16	32	36
microsoft/mpnet-base	wikitext-2-raw-v1	ml.g5.2xlarge	float16	144	160
microsoft/mpnet-base	wikitext-2-raw-v1	ml.p3.2xlarge	float16	106	110
roberta-base	wikitext-2-raw-v1	ml.g5.2xlarge	float16	128	128
roberta-base	wikitext-2-raw-v1	ml.p3.2xlarge	float16	72	98
albert-base-v2	wikitext-2-raw-v1	ml.g5.48xlarge	float16	128	192
albert-base-v2	wikitext-2-raw-v1	ml.p3.16xlarge	float16	95	96
distilbert-base-uncased	wikitext-2-raw-v1	ml.g5.48xlarge	float16	256	256
distilbert-base-uncased	wikitext-2-raw-v1	ml.p3.16xlarge	float16	140	184
google/ electra-small-discriminator	wikitext-2-raw-v1	ml.g5.48xlarge	float16	256	384
google/ electra-small-discriminator	wikitext-2-raw-v1	ml.p3.16xlarge	float16	256	268
gpt2	wikitext-2-raw-v1	ml.g5.48xlarge	float16	116	116
gpt2	wikitext-2-raw-v1	ml.p3.16xlarge	float16	85	83
gpt2	wikitext-2-raw-v1	ml.p4d.24xlarge	float16	94	110
microsoft/mpnet-base	wikitext-2-raw-v1	ml.g5.48xlarge	float16	187	164
microsoft/mpnet-base	wikitext-2-raw-v1	ml.p3.16xlarge	float16	106	111

### TensorFlow 2.10.0 **Modelos de visão computacional (CV)** Testado usando o [TensorFlowModel Garden](https://github.com/tensorflow/models) com precisão mista automática (AMP), conforme indicado.

Nó único GPU única/várias GPU
Modelo	Conjunto de dados	Tipo de instância	Precisão	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
DetectionTransformer- ResNet 50	COCO-2017	ml.g4dn.2xlarge	float32	2	4
DetectionTransformer- ResNet 50	COCO-2017	ml.g5.2xlarge	float32	3	6
DetectionTransformer- ResNet 50	COCO-2017	ml.p3.2xlarge	float32	2	4
Máscara RCNN - 50-FPN ResNet	COCO-2017	ml.g4dn.2xlarge	float16	4	6
Máscara RCNN - 50-FPN ResNet	COCO-2017	ml.g5.2xlarge	float16	6	8
Máscara RCNN - 50-FPN ResNet	COCO-2017	ml.g5.48xlarge	float16	48	64
Máscara RCNN - 50-FPN ResNet	COCO-2017	ml.p3.2xlarge	float16	4	6
ResNet50	ImageNet	ml.g4dn.2xlarge	float16	224	256
ResNet50	ImageNet	ml.g5.2xlarge	float16	192	160
ResNet50	ImageNet	ml.g5.48xlarge	float16	2048	2048
ResNet50	ImageNet	ml.p3.2xlarge	float16	224	160
ResNet101	ImageNet	ml.g4dn.2xlarge	float16	160	128
ResNet101	ImageNet	ml.g5.2xlarge	float16	192	256
ResNet101	ImageNet	ml.g5.48xlarge	float16	2048	2048
ResNet101	ImageNet	ml.p3.2xlarge	float16	160	224
ResNet152	ImageNet	ml.g4dn.2xlarge	float16	128	128
ResNet152	ImageNet	ml.g5.2xlarge	float16	192	224
ResNet152	ImageNet	ml.g5.48xlarge	float16	1536	1792
ResNet152	ImageNet	ml.p3.2xlarge	float16	128	160
VisionTransformer	ImageNet	ml.g4dn.2xlarge	float16	80	128
VisionTransformer	ImageNet	ml.g5.2xlarge	float16	112	144
VisionTransformer	ImageNet	ml.g5.48xlarge	float16	896	1152
VisionTransformer	ImageNet	ml.p3.2xlarge	float16	80	128

Nó único GPU única/várias GPU
Modelo	Conjunto de dados	Tipo de instância	Precisão	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
albert-base-v2	wikitext-2-raw-v1	g4dn.16xlarge	float16	128	112
albert-base-v2	wikitext-2-raw-v1	p3.2xlarge	float16	128	128
albert-base-v2	wikitext-2-raw-v1	p3.8xlarge	float16	128	135
albert-base-v2	wikitext-2-raw-v1	g5.4xlarge	float16	128	191
bert-base-uncased	wikitext-2-raw-v1	g4dn.16xlarge	float16	64	94
bert-base-uncased	wikitext-2-raw-v1	p3.2xlarge	float16	96	101
bert-base-uncased	wikitext-2-raw-v1	p3.8xlarge	float16	96	96
bert-base-uncased	wikitext-2-raw-v1	g5.4xlarge	float16	128	128
bert-large-uncased	wikitext-2-raw-v1	g4dn.16xlarge	float16	35	21
bert-large-uncased	wikitext-2-raw-v1	p3.2xlarge	float16	39	26
bert-large-uncased	wikitext-2-raw-v1	g5.4xlarge	float16	60	50
camembert-base	wikitext-2-raw-v1	g4dn.16xlarge	float16	96	90
camembert-base	wikitext-2-raw-v1	p3.2xlarge	float16	96	98
camembert-base	wikitext-2-raw-v1	p3.8xlarge	float16	96	96
camembert-base	wikitext-2-raw-v1	g5.4xlarge	float16	128	128
distilbert-base-uncased	wikitext-2-raw-v1	g4dn.16xlarge	float16	256	160
distilbert-base-uncased	wikitext-2-raw-v1	p3.2xlarge	float16	128	176
distilbert-base-uncased	wikitext-2-raw-v1	p3.8xlarge	float16	128	160
distilbert-base-uncased	wikitext-2-raw-v1	g5.4xlarge	float16	256	258
google\_ electra-small-discriminator	wikitext-2-raw-v1	g4dn.16xlarge	float16	256	216
google\_ electra-small-discriminator	wikitext-2-raw-v1	p3.2xlarge	float16	256	230
google\_ electra-small-discriminator	wikitext-2-raw-v1	p3.8xlarge	float16	256	224
google\_ electra-small-discriminator	wikitext-2-raw-v1	g5.4xlarge	float16	256	320
gpt2	wikitext-2-raw-v1	g4dn.16xlarge	float16	80	64
gpt2	wikitext-2-raw-v1	p3.2xlarge	float16	80	77
gpt2	wikitext-2-raw-v1	p3.8xlarge	float16	80	72
gpt2	wikitext-2-raw-v1	g5.4xlarge	float16	128	120
jplu\_ tf-xlm-roberta-base	wikitext-2-raw-v1	g4dn.16xlarge	float16	28	24
jplu\_ tf-xlm-roberta-base	wikitext-2-raw-v1	p3.2xlarge	float16	32	24
jplu\_ tf-xlm-roberta-base	wikitext-2-raw-v1	p3.8xlarge	float16	32	26
jplu\_ tf-xlm-roberta-base	wikitext-2-raw-v1	g5.4xlarge	float16	66	52
microsoft\_mpnet-base	wikitext-2-raw-v1	g4dn.16xlarge	float16	96	92
microsoft\_mpnet-base	wikitext-2-raw-v1	p3.2xlarge	float16	96	101
microsoft\_mpnet-base	wikitext-2-raw-v1	p3.8xlarge	float16	96	101
microsoft\_mpnet-base	wikitext-2-raw-v1	g5.4xlarge	float16	128	152
roberta-base	wikitext-2-raw-v1	g4dn.16xlarge	float16	64	72
roberta-base	wikitext-2-raw-v1	p3.2xlarge	float16	64	84
roberta-base	wikitext-2-raw-v1	p3.8xlarge	float16	64	86
roberta-base	wikitext-2-raw-v1	g5.4xlarge	float16	128	128

### TensorFlow 2.9.1 Testado usando o [TensorFlowModel Garden](https://github.com/tensorflow/models) com precisão mista automática (AMP).

Nó único GPU única/várias GPU
Modelo	Conjunto de dados	Tipo de instância	Tamanho do lote para frameworks nativos	Tamanho do lote para o SageMaker Training Compiler
ResNet50	ImageNet	ml.g4dn.2xlarge	192	256\*
ResNet101	ImageNet	ml.g4dn.2xlarge	128	160
		ml.g5.2xlarge	224	256\*
		ml.p3.16xlarge	1536	1792
ResNet152	ImageNet	ml.g5.2xlarge	192	224
		ml.p3.2xlarge	160	160
		ml.p3.16xlarge	1024	1.280
VisionTransformer	ImageNet	ml.g4dn.2xlarge	80	128\*
		ml.g5.2xlarge	112	128\*
		ml.p3.2xlarge	56	128\*
		ml.p3.16xlarge	640	1024\*
DetectionTransformer- ResNet 50	COCO-2017	ml.g4dn.2xlarge	2	2
		ml.g5.2xlarge	3	6
		ml.p3.2xlarge	2	4
		ml.p3.16xlarge	8	32
Máscara RCNN - 50-FPN ResNet	COCO-2017	ml.g4dn.2xlarge	4	4
		ml.g5.2xlarge	6	8
		ml.p3.2xlarge	4	6

\* Os tamanhos de lote marcados com o símbolo de asterisco (\*) indicam o maior tamanho de lote testado pela equipe de desenvolvedores do SageMaker Training Compiler. Para as células marcadas, a instância pode caber em um tamanho de lote maior do que o indicado. ### Transformers 4.21.1 com 1.11.0 PyTorch Testado com `Sequence_Len=512` precisão mista automática (AMP).

Nó único GPU única
Modelo	Conjunto de dados	Tipo de instância	Contagem de instâncias	Tamanho do lote para frameworks nativos	Tamanho do lote para o Training Compiler
albert-base-v2	wikitext-2	ml.g4dn.2xlarge	1	14	28
		ml.g5.2xlarge	1	18	40
		ml.p3.2xlarge	1	14	32
bert-base-cased	wikitext-2	ml.g4dn.2xlarge	1	12	24
		ml.g5.2xlarge	1	28	44
		ml.p3.2xlarge	1	16	20
camembert-base	wikitext-2	ml.g4dn.2xlarge	1	16	28
		ml.g5.2xlarge	1	24	40
		ml.p3.2xlarge	1	16	24
distilbert-base-uncased	wikitext-2	ml.g4dn.2xlarge	1	28	52
		ml.g5.2xlarge	1	40	76
		ml.p3.2xlarge	1	32	48
	wikitext-103-v1	ml.p4d.24xlarge	4	82	160
distil2	wikitext-2	ml.g4dn.2xlarge	1	6	18
		ml.g5.2xlarge	1	12	28
		ml.p3.2xlarge	1	6	16
distilroberta-base	wikitext-2	ml.g4dn.2xlarge	1	20	40
		ml.g5.2xlarge	1	28	56
		ml.p3.2xlarge	1	24	40
EleutherAI/gpt-neo-125M	wikitext-2	ml.g4dn.2xlarge	1	4	8
		ml.g5.2xlarge	1	6	14
		ml.p3.2xlarge	1	4	10
gpt2	wikitext-2	ml.g4dn.2xlarge	1	4	8
		ml.g5.2xlarge	1	6	16
		ml.p3.2xlarge	1	4	10
	wikitext-103-v1	ml.p4d.24xlarge	4	13	25
roberta-base	wikitext-2	ml.g4dn.2xlarge	1	12	20
		ml.g5.2xlarge	1	24	36
		ml.p3.2xlarge	1	12	20
	wikitext-103-v1	ml.p4d.24xlarge	4	36	64
xlnet-base-cased	wikitext-2	ml.g4dn.2xlarge	1	2	6
		ml.g5.2xlarge	1	2	10
		ml.p3.2xlarge	1	2	8
bert-base-uncased	wikitext-103-v1	ml.p4d.24xlarge	2	32	64
			4	32	64
			8	32	64
			16	32	64
roberta-large	wikitext-103-v1	ml.p4d.24xlarge	4	16	24
microsoft/deberta-v3-base	wikitext-103-v1	ml.p4d.24xlarge	16	9	23

### Transformers 4.17.0 com 1.10.2 PyTorch Testado com `Sequence_Len=512` precisão mista automática (AMP).

Nó único GPU única
Modelo	Tipo de instância	Tamanho do lote para frameworks nativos	Tamanho do lote para o Training Compiler
albert-base-v2	ml.p3.2xlarge	14	28
albert-base-v2	ml.g4dn.2xlarge	14	24
bert-base-cased	ml.p3.2xlarge	16	24
bert-base-cased	ml.g4dn.2xlarge	12	24
bert-base-uncased	ml.p3.2xlarge	16	24
bert-base-uncased	ml.g4dn.2xlarge	12	28
camembert-base	ml.p3.2xlarge	12	24
camembert-base	ml.g4dn.2xlarge	12	28
distilbert-base-uncased	ml.p3.2xlarge	28	48
distilbert-base-uncased	ml.g4dn.2xlarge	24	52
distil2	ml.p3.2xlarge	6	12
distil2	ml.g4dn.2xlarge	6	14
distilroberta-base	ml.p3.2xlarge	20	40
distilroberta-base	ml.g4dn.2xlarge	12	40
EleutherAI/gpt-neo-125M	ml.p3.2xlarge	2	10
EleutherAI/gpt-neo-125M	ml.g4dn.2xlarge	2	8
facebook/bart-base	ml.p3.2xlarge	2	6
facebook/bart-base	ml.g4dn.2xlarge	2	6
gpt2	ml.p3.2xlarge	4	8
gpt2	ml.g4dn.2xlarge	2	8
roberta-base	ml.p3.2xlarge	12	20
roberta-base	ml.g4dn.2xlarge	12	20
xlnet-base-cased	ml.p3.2xlarge	2	8
xlnet-base-cased	ml.g4dn.2xlarge	4	6

### Transformers 4.11.0 com 1.9.0 PyTorch Testado com `Sequence_Len=512` precisão mista automática (AMP).

Nó único GPU única
Modelo	Tipo de instância	Tamanho do lote para nativo	Tamanho do lote para o Training Compiler
albert-base-v2	ml.p3.2xlarge	12	32
bert-base-cased	ml.p3.2xlarge	14	24
bert-base-chinese	ml.p3.2xlarge	16	24
bert-base-multilingual-cased	ml.p3.2xlarge	4	16
bert-base-multilingual-uncased	ml.p3.2xlarge	8	16
bert-base-uncased	ml.p3.2xlarge	12	24
cl-tohoku/ -mascaramento de palavras bert-base-japanese-whole	ml.p3.2xlarge	12	24
cl-tohoku/ bert-base-japanese	ml.p3.2xlarge	12	24
distilbert-base-uncased	ml.p3.2xlarge	28	32
distilbert-base-uncased-finetuned-sst-2-inglês	ml.p3.2xlarge	28	32
distil2	ml.p3.2xlarge	16	32
facebook/bart-base	ml.p3.2xlarge	4	8
gpt2	ml.p3.2xlarge	6	20
Neimers/MINI LMv2 -L6-H384- distilled-from-RoBERTa-Large	ml.p3.2xlarge	20	32
roberta-base	ml.p3.2xlarge	12	20

Nó único várias GPUs
Modelo	Tipo de instância	Tamanho do lote para nativo	Tamanho do lote para o Training Compiler
bert-base-chinese	ml.p3.8xlarge	16	26
bert-base-multilingual-cased	ml.p3.8xlarge	6	16
bert-base-multilingual-uncased	ml.p3.8xlarge	6	16
bert-base-uncased	ml.p3.8xlarge	14	24
distilbert-base-uncased	ml.p3.8xlarge	14	32
distil2	ml.p3.8xlarge	6	32
facebook/bart-base	ml.p3.8xlarge	8	16
gpt2	ml.p3.8xlarge	8	20
roberta-base	ml.p3.8xlarge	12	20

### Transformers 4.17.0 com 2.6.3 TensorFlow Testado com `Sequence_Len=128` precisão mista automática (AMP). | Modelo | Tipo de instância | Tamanho do lote para frameworks nativos | Tamanho do lote para o Training Compiler | | --- | --- | --- | --- | | albert-base-v2 | ml.g4dn.16xlarge | 136 | 208 | | albert-base-v2 | ml.g5.4xlarge | 219 | 312 | | albert-base-v2 | ml.p3.2xlarge | 152 | 208 | | albert-base-v2 | ml.p3.8xlarge | 152 | 192 | | bert-base-uncased | ml.g4dn.16xlarge | 120 | 101 | | bert-base-uncased | ml.g5.4xlarge | 184 | 160 | | bert-base-uncased | ml.p3.2xlarge | 128 | 108 | | bert-large-uncased | ml.g4dn.16xlarge | 37 | 28 | | bert-large-uncased | ml.g5.4xlarge | 64 | 55 | | bert-large-uncased | ml.p3.2xlarge | 40 | 32 | | camembert-base | ml.g4dn.16xlarge | 96 | 100 | | camembert-base | ml.g5.4xlarge | 190 | 160 | | camembert-base | ml.p3.2xlarge | 129 | 108 | | camembert-base | ml.p3.8xlarge | 128 | 104 | | distilbert-base-uncased | ml.g4dn.16xlarge | 210 | 160 | | distilbert-base-uncased | ml.g5.4xlarge | 327 | 288 | | distilbert-base-uncased | ml.p3.2xlarge | 224 | 196 | | distilbert-base-uncased | ml.p3.8xlarge | 192 | 182 | | google\_ electra-small-discriminator | ml.g4dn.16xlarge | 336 | 288 | | google\_ electra-small-discriminator | ml.g5.4xlarge | 504 | 384 | | google\_ electra-small-discriminator | ml.p3.2xlarge | 352 | 323 | | gpt2 | ml.g4dn.16xlarge | 89 | 64 | | gpt2 | ml.g5.4xlarge | 140 | 146 | | gpt2 | ml.p3.2xlarge | 94 | 96 | | gpt2 | ml.p3.8xlarge | 96 | 88 | | jplu\_ tf-xlm-roberta-base | ml.g4dn.16xlarge | 52 | 16 | | jplu\_ tf-xlm-roberta-base | ml.g5.4xlarge | 64 | 44 | | microsoft\_mpnet-base | ml.g4dn.16xlarge | 120 | 100 | | microsoft\_mpnet-base | ml.g5.4xlarge | 192 | 160 | | microsoft\_mpnet-base | ml.p3.2xlarge | 128 | 104 | | microsoft\_mpnet-base | ml.p3.8xlarge | 130 | 92 | | roberta-base | ml.g4dn.16xlarge | 108 | 64 | | roberta-base | ml.g5.4xlarge | 176 | 142 | | roberta-base | ml.p3.2xlarge | 118 | 100 | | roberta-base | ml.p3.8xlarge | 112 | 88 | ### Transformers 4.11.0 com 2.5.1 TensorFlow Testado com `Sequence_Len=128` precisão mista automática (AMP).

Nó único GPU única
Modelo	Tipo de instância	Tamanho do lote para nativo	Tamanho do lote para o Training Compiler
albert-base-v2	ml.p3.2xlarge	128	128
bart-base	ml.p3.2xlarge	12	64
bart-large	ml.p3.2xlarge	4	28
bert-base-cased	ml.p3.2xlarge	16	128
bert-base-chinese	ml.p3.2xlarge	16	128
bert-base-multilingual-cased	ml.p3.2xlarge	12	64
bert-base-multilingual-uncased	ml.p3.2xlarge	16	96
bert-base-uncased	ml.p3.2xlarge	16	96
bert-large-uncased	ml.p3.2xlarge	4	24
cl-tohoku/ bert-base-japanese	ml.p3.2xlarge	16	128
cl-tohoku/ -mascaramento de palavras bert-base-japanese-whole	ml.p3.2xlarge	16	128
distilbert-base-sst2	ml.p3.2xlarge	32	128
distilbert-base-uncased	ml.p3.2xlarge	32	128
distil2	ml.p3.2xlarge	32	128
gpt2	ml.p3.2xlarge	12	64
gpt2-large	ml.p3.2xlarge	2	24
jplu/ tf-xlm-roberta-base	ml.p3.2xlarge	12	32
roberta-base	ml.p3.2xlarge	4	64
roberta-large	ml.p3.2xlarge	4	64
t5-base	ml.p3.2xlarge	64	64
t5.small	ml.p3.2xlarge	128	128