SageMaker HyperPod Referenzen - Amazon SageMaker AI

SageMaker HyperPod Referenzen

Weitere Informationen und Referenzen zur Verwendung von SageMaker HyperPod finden Sie in den folgenden Themen.

Preise von SageMaker HyperPod

Die folgenden Themen enthalten Informationen zu den Preisen von SageMaker HyperPod. Weitere Informationen zum Preis pro Stunde für die Nutzung von SageMaker HyperPod-Instances finden Sie auch unter Amazon SageMaker SageMaker-Preise.

Kapazitätsanfragen

Sie können mit SageMaker AI Rechenkapazität auf Abruf oder reservierte Rechenkapazität für die Verwendung auf SageMaker HyperPod zuweisen. Bei der On-Demand-Clustererstellung werden verfügbare Kapazitäten aus dem On-Demand-Kapazitätspool von SageMaker AI zugewiesen. Alternativ können Sie reservierte Kapazität anfordern, um den Zugriff sicherzustellen, indem Sie ein Ticket für eine Erhöhung des Kontingents einreichen. Eingehende Kapazitätsanfragen werden von SageMaker AI priorisiert und Sie erhalten eine geschätzte Zeit für die Kapazitätszuweisung.

Service – Fakturierung

Wenn Sie eine Rechenkapazität auf SageMaker HyperPod bereitstellen, wird Ihnen die Dauer der Kapazitätszuweisung in Rechnung gestellt. Die Abrechnung mit SageMaker HyperPod erscheint in Ihren Jubiläumsrechnungen mit einer Zeile für die Art der Kapazitätszuweisung (auf Abruf, reserviert), den Instance-Typ und die für die Nutzung der Instance aufgewendete Zeit.

Informationen zum Einreichen eines Tickets für eine Erhöhung des Kontingents finden Sie unter SageMaker-HyperPod-Kontingente.

SageMaker HyperPod APIs

Die folgende Liste enthält einen vollständigen Satz von SageMaker HyperPod APIs zum Senden von Aktionsanfragen im JSON-Format an SageMaker AI über oder. AWS CLI AWS SDK für Python (Boto3)

SageMaker HyperPod Formulare

Um das Slurm-Workload-Manager-Tool auf HyperPod zu konfigurieren, sollten Sie mithilfe des bereitgestellten Formulars eine von HyperPod benötigte Slurm-Konfigurationsdatei erstellen.

Konfigurationsformular für die Bereitstellung von Slurm-Knoten auf HyperPod

Der folgende Code ist das Slurm-Konfigurationsformular, das Sie vorbereiten sollten, um Slurm-Knoten auf Ihrem HyperPod-Cluster ordnungsgemäß einzurichten. Sie sollten dieses Formular ausfüllen und es während der Clustererstellung als Teil einer Reihe von Lebenszyklusskripten hochladen. Informationen darüber, wie dieses Formular während der Erstellung eines HyperPod-Clusters vorbereitet werden sollte, finden Sie unterAnpassen von SageMaker-HyperPod-Clustern mithilfe von Lebenszyklusskripten.

// Save as provisioning_parameters.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "string", "login_group": "string", "worker_groups": [ { "instance_group_name": "string", "partition_name": "string" } ], "fsx_dns_name": "string", "fsx_mountname": "string" }
  • version – Erforderlich. Dies ist die Version des HyperPod-Bereitstellungsparameterformulars. Behalte es bei. 1.0.0

  • workload_manager – Erforderlich. Hier können Sie angeben, welcher Workload-Manager auf dem HyperPod-Cluster konfiguriert werden soll. Behalte es bei. slurm

  • controller_group – Erforderlich. Hier geben Sie den Namen der HyperPod-Cluster-Instance-Gruppe an, die Sie dem Slurm-Controller-Knoten (Head) zuweisen möchten.

  • login_group – Optional. Dies dient zur Angabe des Namens der HyperPod-Cluster-Instance-Gruppe, die Sie dem Slurm-Login-Knoten zuweisen möchten.

  • worker_groups – Erforderlich. Dies dient zum Einrichten von Slurm-Worker-Knoten (Compute) auf dem HyperPod-Cluster.

    • instance_group_name – Erforderlich. Dies dient zur Angabe des Namens der HyperPod-Instance-Gruppe, die Sie dem Slurm-Worker-Knoten (Compute) zuweisen möchten.

    • partition_name – Erforderlich. Dies dient zur Angabe des Partitionsnamens für den Knoten.

  • fsx_dns_name – Optional. Wenn Sie Ihre Slurm-Knoten auf dem HyperPod-Cluster für die Kommunikation mit Amazon FSx einrichten möchten, geben Sie den FSx-DNS-Namen an.

  • fsx_mountname – Optional. Wenn Sie Ihre Slurm-Knoten auf dem HyperPod-Cluster für die Kommunikation mit Amazon FSx einrichten möchten, geben Sie den FSx-Mount-Namen an.

SageMaker HyperPod DLAMI

SageMaker HyperPod führt ein DLAMI aus, das auf folgenden Komponenten basiert:

Das SageMaker HyperPod DLAMI wird mit zusätzlichen Paketen zur Unterstützung von Open-Source-Tools wie Slurm, Kubernetes, Dependencies und SageMaker HyperPod Cluster-Softwarepaketen geliefert, um Resilienzfunktionen wie Cluster-Integritätsprüfung und automatische Wiederaufnahme zu unterstützen. Weitere Informationen zu den HyperPod-Softwareupdates, die das HyperPod-Serviceteam über DLAMIs verteilt, finden Sie unter Versionshinweise zu Amazon SageMaker HyperPod.

Referenztabelle für SageMaker HyperPod

Wichtig

Benutzerdefinierte IAM-Richtlinien, die es Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ermöglichen, Amazon-SageMaker-Ressourcen zu erstellen, müssen auch Berechtigungen zum Hinzufügen von Tags zu diesen Ressourcen gewähren. Die Berechtigung zum Hinzufügen von Tags zu Ressourcen ist erforderlich, da Studio und Studio Classic automatisch alle von ihnen erstellten Ressourcen taggen. Wenn eine IAM-Richtlinie Studio und Studio Classic das Erstellen von Ressourcen, aber kein Tagging erlaubt, können bei dem Versuch, Ressourcen zu erstellen, „AccessDenied“-Fehler auftreten. Weitere Informationen finden Sie unter Bereitstellen von Berechtigungen für das Markieren von SageMaker-AI-Ressourcen.

Verwaltete AWS-Richtlinien für Amazon SageMaker AI, die Berechtigungen zum Erstellen von SageMaker-Ressourcen gewähren, enthalten bereits Berechtigungen zum Hinzufügen von Tags während der Erstellung dieser Ressourcen.

Wenn Sie die Zugriffskontrolle für die Ausführung von SageMaker HyperPod-API-Vorgängen einrichten und eine Berechtigungsrichtlinie für Cloud-Administratoren verfassen, verwenden Sie die folgende Tabelle als Referenz.

Amazon SageMaker-API-Betrieb Erforderliche Berechtigungen (API-Aktionen) Ressourcen
CreateCluster sagemaker:CreateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DeleteCluster sagemaker:DeleteCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeCluster sagemaker:DescribeCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
Beschreiben Sie ClusterNode sagemaker:DescribeClusterNode arn:aws:sagemaker:region:account-id:cluster/cluster-id
Clusterknoten auflisten sagemaker:ListClusterNodes arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusters sagemaker:ListClusters arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateCluster sagemaker:UpdateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
Cluster-Software aktualisieren sagemaker:UpdateClusterSoftware arn:aws:sagemaker:region:account-id:cluster/cluster-id

Eine vollständige Liste der Berechtigungen und Ressourcentypen für SageMaker-APIs finden Sie unter Aktionen, Ressourcen und Bedingungsschlüssel für Amazon SageMaker AI in der AWS-Serviceautorisierungsreferenz.

SageMaker HyperPod-Befehle in AWS CLI

Im Folgenden finden Sie die AWS CLI Befehle für SageMaker HyperPod, um die wichtigsten HyperPod-API-Operationen auszuführen.

SageMaker HyperPod Python-Module in AWS SDK für Python (Boto3)

Im Folgenden sind die Methoden des AWS SDK für Python (Boto3) Clients für SageMaker AI aufgeführt, mit denen die wichtigsten HyperPod-API-Operationen ausgeführt werden können.