Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Avvia istanze con Capacity Blocks (CB)
AWS ParallelCluster supporta On-Demand Capacity Reservations (ODCR) e Capacity Blocks (CB) per Machine Learning. A differenza dell'ODCR, CB può avere orari di inizio futuri ed è limitato nel tempo. Per ulteriori informazioni sull'avvio con ODCR, consulta Launch istances with On-Demand Capacity Reservations (ODCR).
Usare CB con AWS ParallelCluster
Per configurare i tuoi cluster nuovi o esistenti per utilizzare un CB, devi prima avere un CB valido nel tuo account. AWS Puoi usare Console di gestione AWS AWS Command Line Interface, o SDK per trovare e acquistare un CB disponibile seguendo la documentazione ufficiale. Una volta che hai un CB valido, puoi impostare il CB Amazon Resource Name (ARN) e i relativi parametri nel tuo file di configurazione. AWS ParallelCluster Per ulteriori informazioni, consulta Find and purchase Capacity Blocks (CB)
CB nella configurazione del cluster
Per utilizzare un CB per una coda specifica è necessario utilizzare il parametro. CapacityReservationId Configuralo su un ID CB esistente. È possibile ottenere l'ARN CB dal AWS CLI, o Console di gestione AWS dall'SDK utilizzato per creare il CB.
È necessario impostare CapacityType = CAPACITY_BLOCK la coda in cui si desidera utilizzare il CB. Impostalo sulla risorsa InstanceType di calcolo (la stessa del tipo di istanza Amazon Elastic Compute Cloud del CB).
Quando lo specifichi CapacityReservationId a livello di risorsa di calcolo, InstanceType è facoltativo perché verrà recuperato automaticamente dalla prenotazione.
Quando si utilizzaCapacityType = CAPACITY_BLOCK, MaxCount deve essere uguale MinCount e maggiore di 0, poiché tutte le istanze che fanno parte della prenotazione CB sono gestite come nodi statici.
Al momento della creazione del cluster, il nodo principale attende che tutti i nodi statici siano pronti prima di segnalare il successo della creazione del cluster. Tuttavia, quando si utilizzaCapacityType = CAPACITY_BLOCK, i nodi che fanno parte delle risorse di elaborazione associate non verranno presi in considerazione per questo controllo. Il cluster verrà creato anche se tutti i dati configurati non sono attivi.
Il seguente frammento di file di configurazione mostra i parametri necessari per l'abilitazione nel file di AWS ParallelCluster configurazione.
SlurmQueues: - Name: string CapacityType: CAPACITY_BLOCK ComputeResources: - Name: string InstanceType: String (EC2 Instance type of the CB) MinCount: integer (<= total capacity of the CB) MaxCount: integer (equal to MinCount) CapacityReservationTarget: CapacityReservationId: String (CB id)
Come AWS ParallelCluster utilizza Capacity Blocks (CB)
AWS ParallelCluster gestisce i nodi statici associati in un modo particolare. AWS ParallelCluster crea un cluster anche se il CB non è ancora attivo e le istanze vengono avviate automaticamente una volta che il CB è attivo.
I Slurm nodi che corrispondono alle risorse di calcolo, sono associati e non sono ancora attivi, vengono mantenuti in manutenzione fino al raggiungimento dell'ora di avvio del CB. Slurmi nodi rimangono in uno reservation/maintenance stato e sono associati all'utente amministratore di slurm. Ciò significa che possono accettare lavori, ma i lavori rimangono pending fino a quando la prenotazione non viene rimossa.
AWS ParallelCluster aggiorna automaticamente Slurm le prenotazioni e mette i relativi nodi CB in stato di manutenzione (corrispondente allo stato CB). Quando il CB è attivo, la Slurm prenotazione viene rimossa e i nodi si avviano e diventano disponibili per i lavori in sospeso o per l'invio di nuovi lavori.
Quando viene raggiunta l'ora di fine del CB, i nodi verranno riportati a uno stato. reservation/maintenance Spetta agli utenti eseguire resubmit/requeue i lavori su una nuova coda/risorsa di calcolo quando il CB non è più attivo e le istanze vengono terminate.