Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Aggiornamento di un cluster in AWS PCS
AWS PCS consente di aggiornare le configurazioni del cluster dopo la creazione tramite l' UpdateCluster API o la console. È possibile modificare le impostazioni del cluster senza ricostruire l'infrastruttura, il che riduce il sovraccarico operativo e minimizza le interruzioni.
Vantaggi degli aggiornamenti dei cluster
L'aggiornamento dei cluster AWS PCS consente di adattare l'infrastruttura HPC ai nuovi requisiti senza interruzioni del servizio. Le modifiche alla configurazione richiedono pochi minuti anziché l'ora o più necessaria per ricostruire i cluster. Questa funzionalità è importante per gli ambienti di produzione che richiedono tempi di inattività minimi e per i team che devono modificare le impostazioni dei cluster al variare dei modelli di carico di lavoro.
Modifiche alla configurazione supportate
È possibile modificare tre categorie principali di impostazioni:
-
Configurazione della contabilità: abilita o disabilita la contabilità gestita e configura le impostazioni di conservazione.
-
Comportamento ridotto: modifica il
scaleDownIdleTimeparametro, che controlla per quanto tempo le istanze dinamiche rimangono inattive prima che AWS PCS le interrompa automaticamente. -
Impostazioni personalizzate Slurm: modifica tutte le impostazioni Slurm supportate che si applicano a livello di cluster, tra cui Prolog, Epilog e. SelectTypeParameters
Limitazioni
Non è possibile modificare determinate configurazioni dopo la creazione del cluster. Ciò include:
-
Configurazioni dei gruppi di sicurezza
-
Selezione della sottorete VPC
-
Dimensione del cluster
-
Versione Slurm
-
Nome cluster
Queste impostazioni sono fondamentali per l'architettura del cluster e richiedono la creazione di un nuovo cluster per modificarle.
Prerequisiti per gli aggiornamenti del cluster
Prima di aggiornare un cluster, assicurati che siano soddisfatte le seguenti condizioni:
-
Il cluster deve essere in
ACTIVEUPDATE_FAILED, o deve essereSUSPENDEDstato -
Tutte le risorse associate (Queues, Compute Node Groups) devono essere in stato
ACTIVE -
È necessario disporre delle autorizzazioni IAM appropriate per l'operazione UpdateCluster
-
Non possono essere in corso altre operazioni di aggiornamento
Processo di aggiornamento e impatto sul lavoro
Durante un'operazione di aggiornamento, i nodi di elaborazione continuano a eseguire i job esistenti anche quando il controller del cluster diventa irraggiungibile per un breve periodo. Tuttavia, il sistema non può accettare nuove candidature di lavoro o prendere decisioni di pianificazione durante questo periodo.
È possibile monitorare gli aggiornamenti del cluster tramite le interfacce della console e dell'API. Il cluster passerà attraverso i seguenti stati durante un aggiornamento:
-
UPDATING- Aggiornamento in corso -
ACTIVE- Aggiornamento completato con successo -
UPDATE_FAILED- L'aggiornamento ha rilevato un errore
Fatturazione durante gli aggiornamenti
Le tariffe orarie standard per il cluster AWS PCS continuano durante le operazioni di aggiornamento. Quando aggiorni un cluster per disabilitare la contabilità, la fatturazione per la funzionalità di contabilità si interrompe non appena il cluster entra nello stato. UPDATING Quando si abilita la contabilità, la fatturazione non inizia finché il cluster non completa correttamente l'aggiornamento e torna allo stato. ACTIVE