Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Domande frequenti sulle versioni Slurm in PCS AWS
AWS PCS mantiene il supporto per più versioni di Slurm. Quando viene introdotta una nuova versione di Slurm, AWS PCS fornisce supporto tecnico e patch di sicurezza fino al raggiungimento della fine del supporto (EOS) da SchedMD. AWS PCS fa riferimento alla data EOS per una versione di Slurm come fine del ciclo di vita (EOL) per coerenza con la terminologia. AWS
Per quanto tempo AWS PCS supporta una versione Slurm?
AWS Il supporto PCS per le versioni di Slurm è in linea con i cicli di supporto di SchedMD per le versioni principali. AWS PCS supporta la versione corrente e le 2 versioni principali precedenti più recenti. Quando SchedMD rilascia una nuova versione principale, AWS PCS termina il supporto per la versione più vecchia supportata. AWS PCS rilascia nuove versioni principali di Slurm il prima possibile, ma potrebbe esserci un ritardo tra il rilascio di SchedMD e la sua disponibilità in PCS. AWS
In che modo i miei cluster ottengono nuove versioni di patch per Slurm?
Per risolvere bug e correzioni di sicurezza, AWS PCS è progettato per applicare automaticamente le patch ai controller del cluster eseguiti in account interni di proprietà dei servizi. Per installare patch sulle EC2 istanze nel tuo Account AWS, aggiorna l'Amazon Machine Image (AMI) per i tuoi gruppi di nodi di calcolo e aggiorna i gruppi di nodi di calcolo per utilizzare l'AMI aggiornata. Per ulteriori informazioni, consulta Immagini di macchine Amazon personalizzate (AMIs) per AWS PCS.
Nota
I controller Slurm non sono disponibili durante l'aggiornamento. I lavori in esecuzione non sono influenzati. I lavori inviati prima che il controller del cluster diventasse non disponibile vengono mantenuti fino a quando il controller non è disponibile.
Come posso essere informato su un imminente evento EOL della versione Slurm?
Ti invieremo un messaggio e-mail 6 mesi prima della data EOL. Ti inviamo un messaggio e-mail ogni mese prima dell'EOL, con un messaggio e-mail finale 1 settimana prima della data EOL. Dopo la data EOL, inviamo messaggi e-mail mensili per 12 mesi ai clienti che utilizzano cluster AWS PCS con versioni EOL Slurm. Potremmo sospendere un cluster con una versione EOL Slurm se vengono identificate vulnerabilità di sicurezza per quella versione.
Come posso determinare se la versione Slurm utilizzata dal mio cluster esegue una versione EOL Slurm?
Ti inviamo un messaggio e-mail per informarti che hai un cluster in esecuzione con una versione EOL Slurm. Pubblichiamo un avviso negli AWS Health Dashboard avvisi che contiene i dettagli dei tuoi cluster con versioni EOL Slurm. È inoltre possibile utilizzare la console AWS PCS per identificare i cluster con versioni EOL Slurm.
Cosa devo fare se la mia versione di Slurm è prossima o superiore alla fine del ciclo di vita?
Crea un nuovo cluster con una versione più recente supportata di Slurm e aggiorna la versione Slurm nel tuo gruppo di nodi di calcolo. AMIs La versione Slurm nelle tue EC2 istanze AMIs e in esecuzione non può essere inferiore a più di due versioni rispetto alla versione Slurm del cluster. Per ulteriori informazioni, consulta Immagini di macchine Amazon personalizzate (AMIs) per AWS PCS.
Cosa succede se non passo a una versione più recente di Slurm entro la data EOL?
Non è possibile creare nuovi cluster con una versione EOL Slurm. I cluster esistenti possono funzionare fino a 12 mesi senza AWS supporto e non è richiesta alcuna azione immediata per mantenerne il funzionamento. Dopo la data di fine del ciclo di vita, il supporto, gli aggiornamenti di sicurezza e la disponibilità non sono garantiti. Potremmo sospendere un cluster per motivi di sicurezza. Ti consigliamo vivamente di utilizzare una versione Slurm supportata per mantenere la sicurezza e il supporto per i tuoi AWS cluster PCS.
Quali sono i rischi della gestione di un cluster con versioni EOL Slurm?
I cluster con versioni EOL Slurm presentano rischi operativi e di sicurezza significativi. Senza il monitoraggio attivo di SchedMD, le vulnerabilità di sicurezza potrebbero rimanere inosservate o non risolte. Se vengono scoperte vulnerabilità critiche, potremmo sospendere immediatamente i tuoi cluster.
Cosa succede ai miei lavori, alle risorse di calcolo, di archiviazione e di rete del cluster quando il mio cluster viene sospeso?
Tutte le risorse gestite da AWS PCS vengono interrotte. Ciò include il controller Slurm, i gruppi di nodi di calcolo e le istanze. EC2 Tutti i processi in esecuzione su istanze di calcolo vengono immediatamente interrotti e il cluster entra in uno stato sospeso. Le risorse gestite dal cliente, come i file system esterni, rimangono intatte. È possibile utilizzare la console AWS PCS e le azioni API per accedere alla configurazione del cluster.
Posso riavviare un cluster sospeso per riprendere i lavori rimanenti?
No, non è possibile riavviare un cluster sospeso. Puoi utilizzare la configurazione del cluster sospeso per creare un nuovo cluster con una versione Slurm supportata. Puoi eseguire i lavori rimanenti se li hai salvati in un file system esterno.
Posso richiedere una proroga oltre il periodo di grazia di 12 mesi?
No, non puoi richiedere un'estensione per far funzionare il tuo cluster oltre il periodo di grazia di 12 mesi. Forniamo un periodo di tempo prolungato per aiutarti a passare a una versione Slurm supportata. Per evitare interruzioni delle operazioni del cluster, consigliamo di passare alla versione di Slurm prima che la versione di Slurm raggiunga l'EOL.