Note di rilascio del Compilatore di addestramento di Amazon SageMaker - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Note di rilascio del Compilatore di addestramento di Amazon SageMaker

Importante

Amazon Web Services (AWS) annuncia che non sono previsti nuovi rilasci o nuove versioni di Compilatore SageMaker per l’addestramento. È possibile continuare a utilizzare Compilatore SageMaker per l’addestramento tramite i Container AWS per il Deep Learning (Container DL) esistenti per SageMaker Training. È importante notare che, sebbene i Container DL esistenti rimangano accessibili, non riceveranno più patch o aggiornamenti da AWS, in linea con la policy di supporto per i framework dei Container AWS per il Deep Learning.

Consulta le seguenti note di rilascio per tenere traccia degli ultimi aggiornamenti del Compilatore di addestramento di Amazon SageMaker.

Note di rilascio del Compilatore di addestramento SageMaker: 13 febbraio 2023

Aggiornamenti sulla valuta
  • Aggiunto il supporto per PyTorch v1.13.1

Correzioni di bug
  • È stato risolto un problema relativo alle condizioni di gara sulla GPU che causava la perdita di NAN in alcuni modelli come i modelli Vision Transformer (ViT).

Altre modifiche
  • Il Compilatore di addestramento di SageMaker migliora le prestazioni permettendo a PyTorch/XLA di sovrascrivere automaticamente gli ottimizzatori (come SGD, Adam, AdamW) in torch.optim o transformers.optimization con le loro versioni syncfree in torch_xla.amp.syncfree (come torch_xla.amp.syncfree.SGD, torch_xla.amp.syncfree.Adam, torch_xla.amp.syncfree.AdamW). Non è necessario modificare le righe di codice in cui si definiscono gli ottimizzatori nello script di addestramento.

Migrazione a AWSDeep Learning Containers

Questa versione ha superato i test di benchmark ed è stata migrata al seguente AWS Deep Learning Container:

Note di rilascio del Compilatore di addestramento SageMaker: 9 gennaio 2023

Modifiche rivoluzionarie

  • tf.keras.optimizers.Optimizer punta a un nuovo ottimizzatore in TensorFlow 2.11.0 e versioni successive. I vecchi ottimizzatori vengono spostati in tf.keras.optimizers.legacy. Un processo potrebbe avere esito negativo a causa di una modifica rivoluzionaria quando esegui le seguenti operazioni.

    • Carica i checkpoint da un vecchio ottimizzatore. Ti consigliamo di passare all'utilizzo degli ottimizzatori precedenti.

    • Usa TensorFlow v1. Ti consigliamo di migrare a TensorFlow v2 o di passare agli ottimizzatori legacy se devi continuare a utilizzare TensorFlow v1.

    Per un elenco più dettagliato delle modifiche apportate all'ottimizzatore, consulta le note di rilascio ufficiali di TensorFlow v2.11.0 nel repository GitHub di TensorFlow.

Migrazione a AWSDeep Learning Containers

Questa versione ha superato i test di benchmark ed è stata migrata al seguente AWS Deep Learning Container:

Note di rilascio del Compilatore di addestramento SageMaker: 8 dicembre 2022

Correzioni di bug

Problemi noti

  • L'uso improprio delle API PyTorch/XLA nei trasformatori di visione di Hugging Face potrebbe portare a problemi di convergenza.

Altre modifiche

Migrazione a AWSDeep Learning Containers

Questa versione ha superato i test di benchmark ed è stata migrata al seguente AWS Deep Learning Container:

  • PyTorch v1.12.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-trcomp-training:1.12.0-gpu-py38-cu113-ubuntu20.04-sagemaker

    Per trovare un elenco completo dei container predefiniti con il Compilatore di addestramento di Amazon SageMaker, consulta Framework supportati, Regioni AWS, tipi di istanze e modelli testati.

Note di rilascio del Compilatore di addestramento SageMaker: 4 ottobre 2022

Aggiornamenti sulla valuta
  • Aggiunto il supporto per Tensorflow v2.10.0.

Altre modifiche
  • Aggiunti modelli Hugging Face NLP che utilizzano la libreria Transformers ai test del framework TensorFlow. Per trovare i modelli Transformer testati, consulta Modelli testati.

Migrazione a AWSDeep Learning Containers

Questa versione ha superato i test di benchmark ed è stata migrata al seguente AWS Deep Learning Container:

  • TensorFlow v2.10.0

    763104351884.dkr.ecr.<region>.amazonaws.com/tensorflow-training:2.10.0-gpu-py39-cu112-ubuntu20.04-sagemaker

    Per trovare un elenco completo dei container predefiniti con il Compilatore di addestramento di Amazon SageMaker, consulta Framework supportati, Regioni AWS, tipi di istanze e modelli testati.

Note di rilascio del Compilatore di addestramento SageMaker: 1 settembre 2022

Aggiornamenti sulla valuta
  • Aggiunto il supporto per Hugging Face Transformers v4.21.1 con PyTorch v1.11.0.

Miglioramenti
Migrazione a AWSDeep Learning Containers

Questa versione ha superato i test di benchmark ed è stata migrata al seguente AWS Deep Learning Container:

Note di rilascio del Compilatore di addestramento SageMake: 14 giugno 2022

Nuove caratteristiche
Migrazione a AWSDeep Learning Containers

Questa versione ha superato i test di benchmark ed è stata migrata al seguente AWS Deep Learning Container:

Note di rilascio del Compilatore di addestramento SageMaker: 26 aprile 2022

Miglioramenti
  • È stato aggiunto il supporto per tutte le Regioni AWS in cui i AWSDeep Learning Containers sono in servizio, ad eccezione delle Regioni della Cina.

Note di rilascio del Compilatore di addestramento SageMaker: 12 aprile 2022

Aggiornamenti sulla valuta
  • Aggiunto il supporto per Hugging Face Transformers v4.17.0 con TensorFlow v2.6.3 e PyTorch v1.10.2.

Note di rilascio del Compilatore di addestramento SageMaker: 21 febbraio 2022

Miglioramenti
  • Test di benchmark completato e accelerazione confermata dell’addestramento sui tipi di istanze ml.g4dn. Per un elenco completo delle istanze ml testate, consulta Tipi di istanze supportati.

Note di rilascio del Compilatore di addestramento SageMaker: 1 dicembre 2021

Nuove caratteristiche
  • Lanciato il Compilatore di addestramento Amazon SageMaker in AWS re:Invent 2021.

Migrazione a AWSDeep Learning Containers