Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Esecuzione di job di addestramento in un cluster eterogeneo
Utilizzando la funzionalità di cluster eterogeneo di SageMaker Training, puoi eseguire un processo di formazione con diversi tipi di istanze ML per una migliore scalabilità e utilizzo delle risorse per diverse attività e scopi di formazione ML. Ad esempio, se il processo di formazione su un cluster con istanze GPU presenta un basso utilizzo della GPU e problemi di collo di bottiglia della CPU dovuti alle CPU-intensive attività, l'utilizzo di un cluster eterogeneo può contribuire a ridurre il carico delle CPU-intensive attività aggiungendo gruppi di istanze CPU più convenienti, risolvere tali problemi di collo di bottiglia e ottenere un migliore utilizzo della GPU.
Nota
Questa funzionalità è disponibile in SageMaker Python SDK v2.98.0 e versioni successive.
Nota
Questa funzionalità è disponibile tramite le classi SageMaker AI PyTorch
Consulta anche il blog Migliora il rapporto prezzo/prestazioni del tuo modello di formazione utilizzando i cluster eterogenei di Amazon SageMaker AI