Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Libreria di parallelismo dei SageMaker modelli (archiviata) v1.x
Importante
A partire dal 19 dicembre 2023, viene rilasciata la libreria di parallelismo dei SageMaker modelli (SMP) v2. Le funzionalità di SMP v1 non saranno più supportate nelle versioni future a favore della libreria SMP v2. La sezione e gli argomenti seguenti sono archiviati e riguardano specificamente l’uso della libreria SMP v1. Per informazioni su come utilizzare la libreria SMP v2, consulta SageMaker libreria di parallelismo dei modelli v2.
Usa la libreria parallela di modelli di Amazon SageMaker AI per addestrare modelli di deep learning (DL) di grandi dimensioni che sono difficili da addestrare a causa delle limitazioni della memoria della GPU. La libreria suddivide automaticamente ed efficacemente un modello su più GPU e istanze. Utilizzando la libreria, puoi raggiungere più rapidamente l'obiettivo di precisione di previsione addestrando in modo efficiente modelli DL più grandi con miliardi o trilioni di parametri.
Puoi utilizzare la libreria per partizionare automaticamente i tuoi PyTorch modelli su più GPU TensorFlow e più nodi con modifiche minime al codice. Puoi accedere all'API della libreria tramite SageMaker Python SDK.
Utilizza le seguenti sezioni per saperne di più sul parallelismo dei modelli e sulla libreria di modelli SageMaker paralleli. La documentazione API di questa libreria si trova in Distributed Training APIs
Argomenti
Caratteristiche principali della SageMaker Model Parallelism Library
Esegui un job di formazione SageMaker distribuito con Model Parallelism
Checkpointing e Fine-Tuning un modello con parallelismo dei modelli
Esempi della libreria di parallelismo dei modelli Amazon SageMaker AI v1
SageMaker Best practice per il parallelismo dei modelli distribuiti
Suggerimenti e insidie per la configurazione della SageMaker Distributed Model Parallelism Library