As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Biblioteca de paralelismo de modelos do SageMaker v1.x (arquivada)
Importante
Em 19 de dezembro de 2023, foi lançada a biblioteca de paralelismo de modelos (SMP) v2 do SageMaker. Em benefício da biblioteca de SMP v2, os recursos de SMP v1 não serão mais acessíveis em versões futuras. A seção e os tópicos a seguir são arquivados e específicos para o uso da biblioteca de SMP v1. Para obter mais informações sobre o uso da biblioteca de SMP v2, consulte Biblioteca de paralelismo de modelos do SageMaker v2.
Use a biblioteca de paralelismo de modelos do Amazon SageMaker AI para treinar grandes modelos de aprendizado profundo (DL) que são difíceis de treinar devido a limitações de memória da GPU. A biblioteca divide um modelo de forma automática e eficiente em várias GPUs e instâncias. Usando a biblioteca, você pode obter uma precisão de predição de metas mais rapidamente treinando com eficiência modelos DL maiores com bilhões ou trilhões de parâmetros.
Você pode usar a biblioteca para particionar automaticamente seus próprios modelos do TensorFlow e do PyTorch em várias GPUs e vários nós com o mínimo de alterações no código. Você pode acessar a API da biblioteca por meio do SageMaker Python SDK.
Use as seções a seguir para saber mais sobre o paralelismo de modelos e a biblioteca paralela de modelos do SageMaker. A documentação da API dessa biblioteca está localizada em APIs de treinamento distribuído
Tópicos
Principais atributos da Biblioteca de paralelismo de modelos do SageMaker
Execute um trabalho de treinamento distribuído do SageMaker com paralelismo de modelos
Apontando pontos de verificação e ajustando um modelo com paralelismo de modelos
Exemplos da biblioteca de paralelismo de modelos do Amazon SageMaker AI v1
Práticas recomendadas de paralelismo de modelos distribuídos pelo SageMaker
Dicas e armadilhas da configuração da biblioteca de paralelismo de modelos distribuídos do SageMaker