Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ridimensionamento automatico dei modelli di SageMaker intelligenza artificiale di Amazon
Amazon SageMaker AI supporta il ridimensionamento automatico (auto scaling) per i tuoi modelli ospitati. Dimensionamento automatico modifica dinamicamente il numero di istanze assegnate a un modello in risposta alle variazioni nel carico di lavoro. Quando il carico di lavoro aumenta, la scalabilità automatica offre più istanze online. Quando il carico di lavoro diminuisce, la scalabilità automatica rimuove le istanze non necessarie in modo da non pagare per le istanze assegnate che non vengono utilizzate.
Argomenti
Configurazione del modello di scalabilità automatica con la console
Controllare lo stato di un’attività di dimensionamento descrivendo le attività di dimensionamento
Test del caricamento della configurazione di scalabilità automatica
Utilizzalo CloudFormation per creare una politica di scalabilità
Aggiornare gli endpoint che utilizzano il dimensionamento automatico
Eliminare gli endpoint configurati per il dimensionamento automatico