Notas de lançamento da biblioteca de paralelismo de dados distribuídos do SageMaker AI - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Notas de lançamento da biblioteca de paralelismo de dados distribuídos do SageMaker AI

Veja as notas de lançamento a seguir para acompanhar as atualizações mais recentes da biblioteca de paralelismo de dados distribuídos do SageMaker AI (SMDDP).

Biblioteca de paralelismo de dados distribuídos do SageMaker AI v2.5.0

Data: 17 de outubro de 2024

Novos recursos

  • Foi adicionada compatibilidade com PyTorch v2.4.1 com CUDA v12.1.

Integração em contêineres do Docker distribuídos pela biblioteca de paralelismo de modelos (SMP) do SageMaker AI

Essa versão da biblioteca SMDDP foi migrada para A biblioteca de paralelismo de modelos do SageMaker v2.6.0.

658645717510.dkr.ecr.<us-west-2>.amazonaws.com/smdistributed-modelparallel:2.4.1-gpu-py311-cu121

Para regiões em que as imagens do Docker SMP estão disponíveis, consulte Regiões da AWS.

Arquivo binário desta versão

Baixe ou instale a biblioteca usando a seguinte URL:

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.4.1/cu121/2024-10-09/smdistributed_dataparallel-2.5.0-cp311-cp311-linux_x86_64.whl

Biblioteca de paralelismo de dados distribuídos do SageMaker AI v2.3.0

Data: 11 de junho de 2024

Novos recursos

  • Foi adicionada compatibilidade com PyTorch v2.3.0 com CUDA v12.1 e Python v3.11.

  • Foi adicionada compatibilidade com o PyTorch Lightining v2.2.5. Ele está integrado no contêiner de framework do SageMaker AI para PyTorch v2.3.0.

  • Adicionada a validação do tipo de instância durante a importação para evitar o carregamento da biblioteca SMDDP em tipos de instância não compatíveis. Para obter uma lista de tipos de instância compatíveis com a biblioteca SMDDP, consulte Frameworks, Regiões da AWS e tipos de instâncias compatíveis.

Integração com contêineres de framework do SageMaker AI

Essa versão da biblioteca de SMDDP foi migrada para o contêiner de framework do SageMaker AI a seguir.

  • PyTorch v2.3.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.3.0-gpu-py311-cu121-ubuntu20.04-sagemaker

Para obter uma lista completa das versões da biblioteca SMDDP e dos contêineres pré-criados, consulte Frameworks, Regiões da AWS e tipos de instâncias compatíveis.

Arquivo binário desta versão

Baixe ou instale a biblioteca usando a seguinte URL:

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.3.0/cu121/2024-05-23/smdistributed_dataparallel-2.3.0-cp311-cp311-linux_x86_64.whl

Outras alterações

  • A biblioteca de SMDDP v2.2.0 está integrada ao contêiner de framework do SageMaker AI para PyTorch v2.2.0.

Biblioteca de paralelismo de dados distribuídos do SageMaker AI v2.2.0

Data: 4 de março de 2024

Novos recursos

  • Foi adicionada compatibilidade com PyTorch v2.2.0 com CUDA v12.1.

Integração em contêineres do Docker distribuídos pela biblioteca de paralelismo de modelos (SMP) do SageMaker AI

Essa versão da biblioteca SMDDP foi migrada para A biblioteca de paralelismo de modelos do SageMaker v2.2.0.

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.2.0-gpu-py310-cu121

Para regiões em que as imagens do Docker SMP estão disponíveis, consulte Regiões da AWS.

Arquivo binário desta versão

Baixe ou instale a biblioteca usando a seguinte URL:

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.2.0/cu121/2024-03-04/smdistributed_dataparallel-2.2.0-cp310-cp310-linux_x86_64.whl

Biblioteca de paralelismo de dados distribuídos do SageMaker AI v2.1.0

Data: 1.º de março de 2024

Novos recursos

  • Foi adicionada compatibilidade com PyTorch v2.1.0 com CUDA v12.1.

Correções de bugs

  • Corrigido o problema de vazamento de memória da CPU em SMDDP v2.0.1.

Integração com contêineres de framework do SageMaker AI

Essa versão da biblioteca de SMDDP foi aprovada no teste comparativo e foi migrada para o contêiner de framework do SageMaker AI a seguir.

  • PyTorch v2.1.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.1.0-gpu-py310-cu121-ubuntu20.04-sagemaker

Integração em contêineres do Docker distribuídos pela biblioteca de paralelismo de modelos (SMP) do SageMaker AI

Essa versão da biblioteca SMDDP foi migrada para A biblioteca de paralelismo de modelos do SageMaker v2.1.0.

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.1.2-gpu-py310-cu121

Para regiões em que as imagens do Docker SMP estão disponíveis, consulte Regiões da AWS.

Arquivo binário desta versão

Baixe ou instale a biblioteca usando a seguinte URL:

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.1.0/cu121/2024-02-04/smdistributed_dataparallel-2.1.0-cp310-cp310-linux_x86_64.whl

Biblioteca de paralelismo de dados distribuídos do SageMaker AI v2.0.1

Data: 7 de dezembro de 2023

Novos recursos

Problemas conhecidos

  • Há um problema de vazamento de memória da CPU devido ao aumento gradual da memória da CPU durante o treinamento com SMDDP AllReduce no modo DDP.

Integração com contêineres de framework do SageMaker AI

Essa versão da biblioteca de SMDDP foi aprovada no teste comparativo e foi migrada para o contêiner de framework do SageMaker AI a seguir.

  • PyTorch v2.0.1

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu118-ubuntu20.04-sagemaker

Arquivo binário desta versão

Baixe ou instale a biblioteca usando a seguinte URL:

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.0.1/cu118/2023-12-07/smdistributed_dataparallel-2.0.2-cp310-cp310-linux_x86_64.whl

Outras alterações

  • A partir dessa versão, a documentação da biblioteca de SMDDP está totalmente disponível no Guia do desenvolvedor do Amazon SageMaker AI. Em favor do guia completo do desenvolvedor para a SMDDP v2 incluído no Guia do desenvolvedor do Amazon SageMaker AI, a documentação para referência adicional da SMDDP v1.x na documentação do SageMaker AI Python SDK não está mais disponível. Se você ainda precisar da documentação da SMP v1:x, veja o seguinte snapshot da documentação na documentação do SageMaker Python SDK v2:212:0: