Modelle mit HyperPod CLI und SDK trainieren und bereitstellen - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Modelle mit HyperPod CLI und SDK trainieren und bereitstellen

Amazon SageMaker HyperPod hilft Ihnen dabei, Modelle für maschinelles Lernen in großem Maßstab zu trainieren und bereitzustellen. Die AWS HyperPod CLI ist eine einheitliche Befehlszeilenschnittstelle, die Workflows für maschinelles Lernen (ML) vereinfacht. AWS Sie abstrahiert die Komplexität der Infrastruktur und bietet eine optimierte Oberfläche für das Einreichen, Überwachen und Verwalten von ML-Schulungsaufträgen. Die CLI wurde speziell für Datenwissenschaftler und ML-Ingenieure entwickelt, die sich eher auf die Modellentwicklung als auf das Infrastrukturmanagement konzentrieren möchten. Dieses Thema führt Sie durch drei wichtige Szenarien: das Trainieren eines PyTorch Modells, das Bereitstellen eines benutzerdefinierten Modells mithilfe trainierter Artefakte und das Bereitstellen eines JumpStart Modells. Dieses kurze Tutorial wurde für Erstbenutzer entwickelt und stellt sicher, dass Sie Modelle mühelos mit der HyperPod CLI oder dem SDK einrichten, trainieren und bereitstellen können. Der Handshake-Prozess zwischen Training und Inferenz hilft Ihnen dabei, Modellartefakte effektiv zu verwalten.

Voraussetzungen

Bevor Sie Amazon nutzen, stellen Sie sicher SageMaker HyperPod, dass Sie über Folgendes verfügen:

  • Ein AWS Konto mit Zugriff auf Amazon SageMaker HyperPod

  • Python 3.9, 3.10 oder 3.11 installiert

  • AWS CLI mit den entsprechenden Anmeldeinformationen konfiguriert.

HyperPod CLI und SDK installieren

Installieren Sie das erforderliche Paket, um auf die CLI und das SDK zuzugreifen:

pip install sagemaker-hyperpod

Dieser Befehl richtet die Tools ein, die für die Interaktion mit HyperPod Clustern erforderlich sind.

Konfigurieren Sie Ihren Cluster-Kontext

HyperPod arbeitet auf Clustern, die für maschinelles Lernen optimiert sind. Führen Sie zunächst die verfügbaren Cluster auf, um einen für Ihre Aufgaben auszuwählen.

  1. Alle verfügbaren Cluster auflisten:

    hyp list-cluster
  2. Wählen Sie Ihren aktiven Cluster aus und legen Sie ihn fest:

    hyp set-cluster-context your-eks-cluster-name
  3. Überprüfen Sie die Konfiguration:

    hyp get-cluster-context
Anmerkung

Alle nachfolgenden Befehle zielen auf den Cluster ab, den Sie als Ihren Kontext festgelegt haben.

Wählen Sie Ihr Szenario

Für detaillierte Anweisungen zu den einzelnen Szenarien klicken Sie auf die folgenden Themen: