Erstellen von SageMaker-HyperPod-Clustern unter Verwendung von CloudFormation-Vorlagen - Amazon SageMaker AI

Erstellen von SageMaker-HyperPod-Clustern unter Verwendung von CloudFormation-Vorlagen

Sie können SageMaker-HyperPod-Cluster unter Verwendung der CloudFormation-Vorlagen für HyperPod erstellen. Sie müssen AWS CLI installieren, um fortzufahren.

Konfigurieren von Ressourcen in der Konsole und Bereitstellen unter Verwendung von CloudFormation

Sie können Ressourcen unter Verwendung der AWS-Managementkonsole konfigurieren und mithilfe der CloudFormation-Vorlagen bereitstellen.

Dazu gehen Sie wie folgt vor:

  1. Anstatt Senden auszuwählen, wählen Sie am Ende des Tutorials in Erste Schritte mit SageMaker HyperPod unter Verwendung der SageMaker-AI-Konsole CloudFormation-Vorlagenparameter herunterladen. Das Tutorial enthält wichtige Konfigurationsinformationen, die Sie benötigen, um Ihren Cluster erfolgreich zu erstellen.

    Wichtig

    Wenn Sie Absenden auswählen, können Sie einen Cluster mit demselben Namen erst bereitstellen, wenn Sie den Cluster löschen.

    Nachdem Sie CloudFormation-Vorlagenparameter herunterladen ausgewählt haben, wird das Fenster Verwenden der Konfigurationsdatei zum Erstellen des Clusters unter Verwendung der AWS CLI rechts auf der Seite angezeigt.

  2. Wählen Sie im Fenster Verwenden der Konfigurationsdatei zum Erstellen des Clusters unter Verwendung der AWS CLI die Option Konfigurationsparameter-Datei herunterladen aus. Die Datei wird auf Ihren Computer heruntergeladen. Sie können die JSON-Konfigurationsdatei nach Ihren Bedürfnissen bearbeiten oder sie unverändert lassen, wenn keine Änderung erforderlich ist.

  3. Navigieren Sie in einem Terminalfenster zum Speicherort der Parameterdatei file://params.json.

  4. Führen Sie den AWS CLI-Befehl create-stack aus, um den CloudFormation-Stack bereitzustellen, der die konfigurierten Ressourcen bereitstellt und den HyperPod-Cluster erstellt.

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. Um den Status der Ressourcenbereitstellung einzusehen, navigieren Sie zur CloudFormation-Konsole.

    Nachdem die Clustererstellung abgeschlossen ist, sehen Sie sich den neuen Cluster unter Cluster im Hauptbereich der SageMaker-HyperPod-Konsole an. Sie können den Status in der Spalte Status überprüfen.

  6. Wenn der Status des Clusters zu InService wechselt, können Sie mit der Anmeldung bei den Clusterknoten beginnen. Informationen zum Zugriff auf die Clusterknoten und zum Starten der Ausführung von ML-Workloads finden Sie unter Aufträge auf SageMaker-HyperPod-Clustern.

Konfigurieren von Ressourcen und Bereitstellen mit CloudFormation

Sie können Ressourcen konfigurieren und mithilfe der CloudFormation-Vorlagen für SageMaker HyperPod bereitstellen.

Dazu gehen Sie wie folgt vor:

  1. Laden Sie eine CloudFormation-Vorlage für SageMaker HyperPod aus dem GitHub-Repository sagemaker-hyperpod-cluster-setup herunter.

  2. Führen Sie den AWS CLI-Befehl create-stack aus, um den CloudFormation-Stack bereitzustellen, der die konfigurierten Ressourcen bereitstellt und den HyperPod-Cluster erstellt.

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. Um den Status der Ressourcenbereitstellung einzusehen, navigieren Sie zur CloudFormation-Konsole.

    Nachdem die Clustererstellung abgeschlossen ist, sehen Sie sich den neuen Cluster unter Cluster im Hauptbereich der SageMaker-HyperPod-Konsole an. Sie können den Status in der Spalte Status überprüfen.

  4. Wenn der Status des Clusters zu InService wechselt, können Sie mit der Anmeldung bei den Clusterknoten beginnen. Informationen zum Zugriff auf die Clusterknoten und zum Starten der Ausführung von ML-Workloads finden Sie unter Aufträge auf SageMaker-HyperPod-Clustern.