Treinamento distribuído com a biblioteca de paralelismo de dados distribuídos do SageMaker AI - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Treinamento distribuído com a biblioteca de paralelismo de dados distribuídos do SageMaker AI

A biblioteca de paralelismo de dados distribuídos do SageMaker AI (SMDDP) foi projetada para facilitar o uso e fornecer integração perfeita com o PyTorch.

Ao treinar um modelo de aprendizado profundo com a biblioteca de SMDDP no SageMaker AI, você pode se concentrar em escrever o seu script de treinamento e o treinamento de modelo.

Para começar, importe a biblioteca SMDDP para usar suas operações coletivas otimizadas para a AWS. Os tópicos a seguir fornecem instruções sobre o que adicionar ao seu script de treinamento, dependendo da operação coletiva que você deseja otimizar.