Passen Sie die Netzwerkschnittstellen für Rechenknoten mit Überschreibungen für Startvorlagen an - AWS ParallelCluster

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Passen Sie die Netzwerkschnittstellen für Rechenknoten mit Überschreibungen für Startvorlagen an

Ab AWS ParallelCluster 3.15.0 können Sie mit diesem LaunchTemplateOverrides Parameter die Netzwerkschnittstellen von Rechenknoten anpassen, indem Sie die standardmäßige Netzwerkschnittstellenkonfiguration mit der Konfiguration in einer referenzierten Startvorlage überschreiben. Der gesamte Netzwerkschnittstellenbereich der Rechenknoten wird durch den Netzwerkschnittstellenbereich der Startvorlage überschrieben, der zum Überschreiben verwendet wird.

In diesem Tutorial wird ein Beispiel für das Überschreiben der standardmäßigen Netzwerkkonfiguration von p6-b300.48xlarge Rechenknoten beschrieben. Diese Anpassung ist nützlich, wenn Sie eine bestimmte Netzwerkschnittstellenkonfiguration benötigen, die sich von der AWS ParallelCluster Standardkonfiguration unterscheidet. In diesem Beispiel konfigurieren wir Anwendungsfall 2 für P6-B300-Instances, wie in der Dokumentation zu den von Amazon EC2 EFA unterstützten Instance-Typen beschrieben.

Anmerkung

Es wird empfohlen, für die Erstellung der Startvorlage anstelle der AWS CLI Konsole die zu verwenden, um maximale Flexibilität zu erzielen.

Anmerkung

Die Startvorlage sollte nur Netzwerkschnittstellen-Overrides enthalten. AWS ParallelCluster hat eine Validierung, die das Überschreiben anderer Parameter verhindert.

Warnung

Wenn Sie die Überschreibung verwenden, um Netzwerkschnittstellen auf eine Weise zu konfigurieren, die vom verwendeten Instance-Typ nicht unterstützt wird, können die Instances nicht gestartet werden.

Voraussetzungen

Schritt 1: Sicherheitsgruppen erstellen

Wenn Sie die Startvorlage erstellen, die beim Override verwendet werden soll, müssen Sie auf eine Sicherheitsgruppe verweisen. Die AWS ParallelCluster Standardsicherheitsgruppe für die Rechenressource ist erst bei der Clustererstellung vorhanden. Sie müssen also eine benutzerdefinierte Sicherheitsgruppe erstellen. Diese Sicherheitsgruppe muss dann von der Sicherheitsgruppe des Hauptknotens referenziert werden, um den Datenverkehr zwischen dem Hauptknoten und den Rechenknoten zu ermöglichen.

Wenn Sie einen vorhandenen Cluster aktualisieren, um neue Kapazitäten anzupassen, können Sie die standardmäßige Sicherheitsgruppe für AWS ParallelCluster Rechenknoten in der Startvorlage verwenden, anstatt eine benutzerdefinierte zu erstellen.

Erstellen Sie die folgenden zwei Sicherheitsgruppen:

  • Zusätzliche Sicherheitsgruppe des Kopfknotens (sg-1234abcd):

    • Eingang: gesamter Datenverkehr von der Computersicherheitsgruppe

  • Sicherheitsgruppe für die Datenverarbeitung (sg-abcd1234):

    • Eingang: gesamter Datenverkehr von der Sicherheitsgruppe des Hauptknotens

    • Eingang: gesamter Verkehr von self () compute-to-compute

    • Ausgang: Standardeinstellung „Alles zulassen“

Schritt 2: Erstellen Sie die Startvorlage

Erstellen Sie eine Startvorlage, die die Netzwerkschnittstellenkonfiguration für p6-b300.48xlarge Rechenknoten definiert. Verwenden Sie für die primäre Netzwerkschnittstelle (Netzwerkkartenindex 0, Geräteindex 0) eine ENA-Netzwerkschnittstelle (Standard). Erstellen Sie für die übrigen Netzwerkkarten eine reine EFA-Schnittstelle (Netzwerkkartenindizes 1—16, Geräteindex 0) und eine ENA-Schnittstelle (Standard) (Netzwerkkartenindizes 1—16, Geräteindex 1).

Führen Sie den folgenden AWS CLI Befehl aus, um die Startvorlage () zu erstellen: lt-123456789

aws ec2 create-launch-template \ --region us-east-1 \ --launch-template-name override-lt \ --launch-template-data '{ "NetworkInterfaces": [ {"NetworkCardIndex":0, "DeviceIndex":0, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":1, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":1, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":2, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":2, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":3, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":3, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":4, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":4, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":5, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":5, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":6, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":6, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":7, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":7, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":8, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":8, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":9, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":9, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":10, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":10, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":11, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":11, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":12, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":12, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":13, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":13, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":14, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":14, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":15, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":15, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":16, "DeviceIndex":0, "InterfaceType":"efa-only", "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"}, {"NetworkCardIndex":16, "DeviceIndex":1, "Groups":["sg-abcd1234"], "SubnetId":"subnet-123456789"} ] }'

Schritt 3: Erstellen Sie den Cluster mit Überschreibungen der Startvorlage

Erstellen Sie eine Clusterkonfiguration, die den LaunchTemplateOverrides Parameter verwendet, um auf die von Ihnen erstellte Startvorlage zu verweisen.

Region: us-east-1 HeadNode: InstanceType: c5.xlarge Networking: SubnetId: subnet-abcdefghi AdditionalSecurityGroups: # Add the head node SG that allows traffic from the compute node SG - sg-1234abcd ... Scheduling: Scheduler: slurm SlurmQueues: - Name: queue0 Networking: SubnetIds: - subnet-123456789 ComputeResources: - Name: compute-resource1 InstanceType: p6-b300.48xlarge Efa: Enabled: false # The override replaces all network interface configuration, so this setting is ignored LaunchTemplateOverrides: LaunchTemplateId: lt-123456789 Version: 1 # If the launch template is updated, then the new version should be specified here.