Biblioteca de paralelismo de modelos do SageMaker v1.x (arquivada)

Importante

Em 19 de dezembro de 2023, foi lançada a biblioteca de paralelismo de modelos (SMP) v2 do SageMaker. Em benefício da biblioteca de SMP v2, os recursos de SMP v1 não serão mais acessíveis em versões futuras. A seção e os tópicos a seguir são arquivados e específicos para o uso da biblioteca de SMP v1. Para obter mais informações sobre o uso da biblioteca de SMP v2, consulte Biblioteca de paralelismo de modelos do SageMaker v2.

Use a biblioteca de paralelismo de modelos do Amazon SageMaker AI para treinar grandes modelos de aprendizado profundo (DL) que são difíceis de treinar devido a limitações de memória da GPU. A biblioteca divide um modelo de forma automática e eficiente em várias GPUs e instâncias. Usando a biblioteca, você pode obter uma precisão de predição de metas mais rapidamente treinando com eficiência modelos DL maiores com bilhões ou trilhões de parâmetros.

Você pode usar a biblioteca para particionar automaticamente seus próprios modelos do TensorFlow e do PyTorch em várias GPUs e vários nós com o mínimo de alterações no código. Você pode acessar a API da biblioteca por meio do SageMaker Python SDK.

Use as seções a seguir para saber mais sobre o paralelismo de modelos e a biblioteca paralela de modelos do SageMaker. A documentação da API dessa biblioteca está localizada em APIs de treinamento distribuído, na documentação do SageMaker Python SDK v2.199.0.

Tópicos

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Notas de lançamento do SMP

Introdução ao paralelismo de modelos