Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Aggiornare gli endpoint che utilizzano il dimensionamento automatico
Quando aggiorni un endpoint, Application Auto Scaling verifica se uno qualsiasi dei modelli su tale endpoint è una destinazione per il dimensionamento automatico. Se l’aggiornamento modifica il tipo di istanza per qualsiasi modello che è una destinazione per il dimensionamento automatico, l’aggiornamento non va a buon fine.
NelConsole di gestione AWS, viene visualizzato un avviso che indica che è necessario annullare la registrazione del modello dal ridimensionamento automatico prima di poterlo aggiornare. Se stai tentando di aggiornare l'endpoint chiamando l'API UpdateEndpoint, la chiamata ha esito negativo. Prima di aggiornare l'endpoint, elimina tutte le politiche di scalabilità configurate per esso e annulla la registrazione della variante come destinazione scalabile chiamando l'azione API Application Auto Scaling DeregisterScalableTarget. Dopo aver aggiornato l’endpoint, puoi registrare la variante aggiornata come destinazione scalabile e collegare una policy di dimensionamento.
Esiste tuttavia un'eccezione. Se modifichi il modello per una variante configurata per la scalabilità automatica, la scalabilità automatica di Amazon SageMaker AI consente l'aggiornamento. Ciò avviene perché la modifica del modello, di solito, non incide abbastanza sulle prestazioni da giustificare un cambiamento nel comportamento di dimensionamento. Se aggiorni un modello per una variante configurata per il dimensionamento automatico, assicurati che la modifica al modello non influenzi significativamente le prestazioni e il comportamento di dimensionamento.
Quando aggiorni gli endpoint SageMaker AI a cui è applicata la scalabilità automatica, completa i seguenti passaggi:
Per aggiornare un endpoint con dimensionamento automatico applicato
-
Annulla la registrazione dell'endpoint come target scalabile chiamando. DeregisterScalableTarget
-
Poiché il dimensionamento automatico è bloccato mentre l’operazione di aggiornamento è in corso (o se è stato disattivato il dimensionamento automatico nella fase precedente), è possibile adottare la precauzione aggiuntiva di aumentare il numero di istanze per l’endpoint durante l’aggiornamento. A questo scopo, aggiornare i conteggi delle istanze per le varianti di produzione ospitate a livello di endpoint chiamando UpdateEndpointWeightsAndCapacities.
-
Chiamare ripetutamente DescribeEndpoint finché il valore del campo
EndpointStatusdella risposta èInService. -
Chiamare DescribeEndpointConfig per ottenere i valori della configurazione endpoint corrente.
-
Creare una nuova configurazione dell'endpoint chiamando CreateEndpointConfig. Per le varianti di produzione in cui si desidera mantenere il conteggio o il peso dell'istanza esistente, utilizzare lo stesso nome della variante dalla risposta dalla chiamata DescribeEndpointConfig al passaggio precedente. Per tutti gli altri valori, utilizzare i valori ottenuti come risposta quando è stato chiamato DescribeEndpointConfig nella fase precedente.
-
Aggiornare l'endpoint chiamando UpdateEndpoint. Specifica la configurazione dell'endpoint creata nella fase precedente come il campo
EndpointConfig. Se si desidera mantenere le proprietà di variante come il conteggio delle istanze o il peso, impostare il valore del parametroRetainAllVariantPropertiessuTrue. Specifica che le varianti di produzione con lo stesso nome verranno aggiornate con ilDesiredInstanceCountpiù recente dalla risposta dalla chiamata aDescribeEndpoint, indipendentemente dai valori del campoInitialInstanceCountnel nuovoEndpointConfig. -
(Facoltativo) Riattiva il ridimensionamento automatico RegisterScalableTargetchiamando e. PutScalingPolicy
Nota
Le fasi 1 e 7 sono necessarie solo se stai aggiornando un endpoint con le seguenti modifiche:
-
Modifica del tipo di istanza per una variante di produzione con dimensionamento automatico configurato
-
Rimozione di una variante di produzione con dimensionamento automatico configurato.