Personalizza le interfacce di rete dei nodi di calcolo con sostituzioni dei modelli di avvio - AWS ParallelCluster

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Personalizza le interfacce di rete dei nodi di calcolo con sostituzioni dei modelli di avvio

A partire dalla AWS ParallelCluster versione 3.15.0, il LaunchTemplateOverrides parametro consente di personalizzare le interfacce di rete dei nodi di calcolo sovrascrivendo la configurazione dell'interfaccia di rete predefinita con la configurazione in un modello di avvio di riferimento. L'intera sezione dell'interfaccia di rete dei nodi di calcolo viene sovrascritta dalla sezione dell'interfaccia di rete del modello di avvio utilizzato per l'override.

Questo tutorial illustra un esempio di sovrascrittura della configurazione di rete predefinita dei nodi di calcolo. p6-b300.48xlarge Questa personalizzazione è utile quando è necessaria una configurazione specifica dell'interfaccia di rete diversa da quella AWS ParallelCluster predefinita. In questo esempio, configuriamo lo use case 2 per le istanze P6-B300 come indicato nella documentazione dei tipi di istanze supportati da Amazon EC2 EFA.

Nota

Si consiglia di utilizzare per creare il modello di avvio AWS CLI anziché la console per la massima flessibilità.

Nota

Il modello di avvio deve contenere solo le sostituzioni delle interfacce di rete. AWS ParallelCluster ha una convalida che impedisce la sovrascrittura di altri parametri.

avvertimento

Se si utilizza l'override per configurare le interfacce di rete in un modo non supportato dal tipo di istanza utilizzato, le istanze non verranno avviate.

Prerequisiti

Fase 1: Creare gruppi di sicurezza

Quando si crea il modello di avvio da utilizzare nell'override, è necessario fare riferimento a un gruppo di sicurezza. Il gruppo AWS ParallelCluster di sicurezza predefinito per la risorsa di calcolo non esiste fino alla creazione del cluster, quindi è necessario creare un gruppo di sicurezza personalizzato. Questo gruppo di sicurezza deve quindi essere referenziato dal gruppo di sicurezza del nodo principale per consentire il traffico tra il nodo principale e i nodi di elaborazione.

Se stai aggiornando un cluster esistente per personalizzare una nuova capacità, puoi utilizzare il gruppo di sicurezza del nodo di AWS ParallelCluster calcolo predefinito nel modello di avvio anziché crearne uno personalizzato.

Crea i due gruppi di sicurezza seguenti:

  • Gruppo di sicurezza aggiuntivo del nodo principale (sg-1234abcd):

    • Ingresso: tutto il traffico proveniente dal gruppo di sicurezza di elaborazione

  • Gruppo di sicurezza di calcolo (): sg-abcd1234

    • Ingresso: tutto il traffico proveniente dal gruppo di sicurezza del nodo principale

    • Ingresso: tutto il traffico proveniente da self () compute-to-compute

    • Uscita: impostazione predefinita allow-all

Fase 2: Creare il modello di lancio

Crea un modello di avvio che definisca la configurazione dell'interfaccia di rete per i nodi di p6-b300.48xlarge calcolo. Per l'interfaccia di rete principale (indice della scheda di rete 0, indice del dispositivo 0), utilizzate un'interfaccia di rete ENA (predefinita). Per le altre schede di rete, create un'interfaccia solo EFA (indici delle schede di rete 1-16, indice del dispositivo 0) e un'interfaccia ENA (predefinita) (indici delle schede di rete 1-16, indice del dispositivo 1).

Eseguite il seguente AWS CLI comando per creare il modello di avvio (): lt-123456789

aws ec2 create-launch-template \ --region us-east-1 \ --launch-template-name override-lt \ --launch-template-data '{ "NetworkInterfaces": [ {"NetworkCardIndex":0, "DeviceIndex":0, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":1, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":1, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":2, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":2, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":3, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":3, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":4, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":4, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":5, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":5, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":6, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":6, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":7, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":7, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":8, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":8, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":9, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":9, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":10, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":10, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":11, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":11, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":12, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":12, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":13, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":13, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":14, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":14, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":15, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":15, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":16, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":16, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"} ] }'

Passaggio 3: Creare il cluster con le sostituzioni del modello di avvio

Crea una configurazione del cluster che utilizzi il LaunchTemplateOverrides parametro per fare riferimento al modello di lancio che hai creato.

Region: us-east-1 HeadNode: InstanceType: c5.xlarge Networking: SubnetId: subnet-abcdefghi AdditionalSecurityGroups: # Add the head node SG that allows traffic from the compute node SG - sg-1234abcd ... Scheduling: Scheduler: slurm SlurmQueues: - Name: queue0 Networking: SubnetIds: - subnet-123456789 ComputeResources: - Name: compute-resource1 InstanceType: p6-b300.48xlarge Efa: Enabled: false # The override replaces all network interface configuration, so this setting is ignored LaunchTemplateOverrides: LaunchTemplateId: lt-123456789 Version: 1 # If the launch template is updated, then the new version should be specified here.