Notas da Versão do Amazon SageMaker Training Compiler - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Notas da Versão do Amazon SageMaker Training Compiler

Importante

A Amazon Web Services (AWS) anuncia que não haverá novos lançamentos ou versões do SageMaker Training Compiler. Você pode continuar a utilizar o SageMaker Training Compiler por meio dos AWS Contêiner de Aprendizado Profundo (DLCs) existentes para o SageMaker Training. É importante observar que, embora os DLCs existentes permaneçam acessíveis, eles não receberão mais versões ou atualizações da AWS, de acordo com a Política de compatibilidade dos frameworks dos contêineres de deep learning da AWS.

Veja as seguintes notas da versão para monitorar as atualizações mais recentes do Amazon SageMaker Training Compiler:

Notas da Versão do SageMaker Training Compiler: 13 de fevereiro de 2023

Atualizações de moeda
  • Adicionada compatibilidade com PyTorch v1.13.1

Correções de bugs
  • Corrigido um problema de condição de corrida na GPU que estava causando perda de NAN em alguns modelos, como os modelos de transformador de visão (ViT).

Outras alterações:
  • O SageMaker Training Compiler melhora o desempenho ao permitir que o PyTorch/XLA substitua automaticamente os otimizadores (como SGD, Adam, AdamW) em torch.optim ou transformers.optimization com suas versões sem sincronização em torch_xla.amp.syncfree (como torch_xla.amp.syncfree.SGD, torch_xla.amp.syncfree.Adam, torch_xla.amp.syncfree.AdamW). Você não precisa alterar as linhas de código nas quais define otimizadores em seu script de treinamento.

Migração para Contêineres de Aprendizado Profundo AWS

Essa versão foi aprovada no teste de benchmark e foi migrada para o seguinte contêiner AWS de aprendizado profundo:

Notas da Versão do SageMaker Training Compiler: 09 de janeiro de 2023

Alterações significativas

  • tf.keras.optimizers.Optimizer aponta para um novo otimizador no TensorFlow 2.11.0 e posteriores. Os otimizadores antigos foram movidos para tf.keras.optimizers.legacy. Você pode encontrar uma falha no trabalho devido à alteração significativa ao fazer o seguinte:

    • Carregar pontos de verificação de um otimizador antigo. Recomendamos que você mude para usar os otimizadores legados.

    • Use o TensorFlow v1. Recomendamos que você migre para o TensorFlow v2 ou mude para os otimizadores legados se precisar continuar usando o TensorFlow v1.

    Para ver uma lista mais detalhada das alterações significativas das alterações do otimizador, consulte as notas de lançamento oficiais do TensorFlow v2.11.0 nos repositórios do GitHub no TensorFlow.

Migração para Contêineres de Aprendizado Profundo AWS

Essa versão foi aprovada no teste de benchmark e foi migrada para o seguinte contêiner AWS de aprendizado profundo:

Notas da Versão do SageMaker Training Compiler: 08 de dezembro de 2022

Correções de bugs

  • Foi corrigida a semente dos trabalhos de treinamento do PyTorch a partir do PyTorch v1.12 para garantir que não haja discrepância na inicialização do modelo em diferentes processos. Veja também Reprodutibilidade do PyTorch.

  • Corrigido o problema que fazia com que os trabalhos de treinamento distribuídos do PyTorch nas instâncias G4dn e G5 não usassem como padrão a comunicação por meio de PCIe.

Problemas conhecidos

  • O uso indevido das APIs PyTorch/XLA nos transformadores de visão do Hugging Face pode levar a problemas de convergência.

Outras alterações

Migração para Contêineres de Aprendizado Profundo AWS

Essa versão foi aprovada no teste de benchmark e foi migrada para o seguinte contêiner AWS de aprendizado profundo:

Notas da Versão do SageMaker Training Compiler: 04 de outubro de 2022

Atualizações de moeda
  • Adicionada compatibilidade com Tensorflow v2.10.0.

Outras alterações
  • Foram adicionados modelos de PNL Hugging Face usando a biblioteca de Transformadores aos testes de framework do TensorFlow. Para encontrar os modelos de transformadores testados, consulte Modelos testados.

Migração para Contêineres de Aprendizado Profundo AWS

Essa versão foi aprovada no teste de benchmark e foi migrada para o seguinte contêiner AWS de aprendizado profundo:

Notas da Versão do SageMaker Training Compiler: 01 de setembro de 2022

Atualizações de moeda
  • Foi adicionada compatibilidade com os transformadores do Hugging Face v4.21.1 com PyTorch v1.11.0.

Melhorias
Migração para Contêineres de Aprendizado Profundo AWS

Essa versão foi aprovada no teste de benchmark e foi migrada para o seguinte contêiner AWS de aprendizado profundo:

Notas da Versão do SageMaker Training Compiler: 14 de junho de 2022

Novos atributos
Migração para Contêineres de Aprendizado Profundo AWS

Essa versão foi aprovada no teste de benchmark e foi migrada para o seguinte contêiner AWS de aprendizado profundo:

Notas da Versão do SageMaker Training Compiler: 26 de abril de 2022

Melhorias

Notas da Versão do SageMaker Training Compiler: 12 de abril de 2022

Atualizações de moeda
  • Foi adicionada compatibilidade com Transformadores do Hugging Face v4.17.0 com TensorFlow v2.6.3 e PyTorch v1.10.2.

Notas da Versão do SageMaker Training Compiler: 21 de fevereiro de 2022

Melhorias
  • Conclusão do teste de benchmark e confirmada a aceleração do treinamento nos tipos de instância ml.g4dn. Para encontrar uma lista completa das instâncias ml testadas, consulte Tipos de instâncias compatíveis.

Notas da Versão do SageMaker Training Compiler: 01 de dezembro de 2021

Novos atributos
  • Lançado Co Amazon SageMaker Training Compiler na AWSre:Invent 2021.

Migração para Contêineres de Aprendizado Profundo AWS