Debuggen von Lebenszykluskonfigurationen in Amazon SageMaker Studio Classic - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Debuggen von Lebenszykluskonfigurationen in Amazon SageMaker Studio Classic

Wichtig

Seit dem 30. November 2023 heißt das vorherige Amazon SageMaker Studio-Erlebnis jetzt Amazon SageMaker Studio Classic. Der folgende Abschnitt bezieht sich konkret auf die Verwendung der Studio-Classic-Anwendung. Informationen zur Verwendung der aktualisierten Studio-Konfiguration finden Sie unter Amazon SageMaker Studio.

Studio Classic wird weiterhin für bestehende Workloads beibehalten, ist aber nicht mehr für das Onboarding verfügbar. Sie können nur vorhandene Studio Classic-Anwendungen beenden oder löschen und keine neuen erstellen. Wir empfehlen Ihnen, Ihren Workload auf das neue Studio-Erlebnis zu migrieren.

In den folgenden Themen erfahren Sie, wie Sie Informationen über Ihre Lebenszykluskonfigurationen abrufen und debuggen.

Überprüfen Sie den Lebenszykluskonfigurationsprozess anhand von CloudWatch Protokollen

Lebenszykluskonfigurationen protokollieren nur STDOUT und STDERR.

STDOUT ist die Standardausgabe für Bash-Skripte. Sie können in STDERR schreiben, indem Sie >&2 an das Ende eines Bash-Befehls anhängen. Beispiel, echo 'hello'>&2.

Protokolle für Ihre Lebenszykluskonfigurationen werden auf Amazon veröffentlicht, wenn Sie Amazon AWS-Konto verwenden CloudWatch. Diese Protokolle finden Sie im /aws/sagemaker/studio Protokollstream in der CloudWatch Konsole.

  1. Öffnen Sie die CloudWatch Konsole unter https://console.aws.amazon.com/cloudwatch/.

  2. Wählen Sie auf der linken Seite Protokolle aus. Wählen Sie im Dropdown-Menü Protokollgruppen aus.

  3. Suchen Sie auf der Seite Protokollgruppen nach aws/sagemaker/studio.

  4. Wählen Sie die -Protokollgruppe aus.

  5. Wählen Sie auf der Seite mit den Details zur Protokollgruppe die Registerkarte Protokollstreams aus.

  6. Um die Logs für eine bestimmte App zu finden, durchsuchen Sie die Log-Streams im folgenden Format:

    domain-id/space-name/app-type/default/LifecycleConfigOnStart

    Um beispielsweise die Protokolle der Lebenszykluskonfiguration für Domain d-m85lcu8vbqmz, Bereichsname i-sonic-js und Anwendungstyp JupyterLab zu finden, verwenden Sie die folgende Suchzeichenfolge:

    d-m85lcu8vbqmz/i-sonic-js/JupyterLab/default/LifecycleConfigOnStart

JupyterServer App-Fehler

Wenn Ihre JupyterServer App aufgrund eines Problems mit der angehängten Lebenszykluskonfiguration abstürzt, zeigt Studio Classic die folgende Fehlermeldung auf dem Studio Classic-Startbildschirm an.

Failed to create SageMaker Studio due to start-up script failure

Wählen Sie den View script logs Link aus, um die CloudWatch Protokolle für Ihre JupyterServer App anzuzeigen.

Wenn die fehlerhafte Lebenszykluskonfiguration in der DefaultResourceSpec Ihrer Domain, Ihres Benutzerprofils oder Ihres gemeinsam genutzten Bereichs angegeben ist, verwendet Studio die Lebenszykluskonfiguration auch nach einem Neustart von Studio weiter.

Um diesen Fehler zu beheben, folgen Sie den Schritten in Standard-Lebenszykluskonfigurationen für Amazon SageMaker Studio Classic festlegen, um das Skript für die Lebenszykluskonfiguration aus dem DefaultResourceSpec zu entfernen oder ein anderes Skript als Standard zu wählen. Starten Sie dann eine neue JupyterServer App.

KernelGateway App-Fehler

Wenn Ihre KernelGateway App aufgrund eines Problems mit der angehängten Lebenszykluskonfiguration abstürzt, zeigt Studio Classic die Fehlermeldung in Ihrem Studio Classic-Notizbuch an.

Wählen SieView script logs, ob Sie die CloudWatch Protokolle für Ihre KernelGateway App anzeigen möchten.

In diesem Fall wird Ihre Lebenszykluskonfiguration im Studio Classic Launcher angegeben, wenn Sie ein neues Studio-Classic-Notebook starten.

Um diesen Fehler zu beheben, verwenden Sie den Studio Classic Launcher, um eine andere Lebenszykluskonfiguration auszuwählen, oder wählen Sie No script aus.

Anmerkung

Eine unter angegebene KernelGateway Standardlebenszykluskonfiguration DefaultResourceSpec gilt für alle KernelGateway Bilder in der Domäne, im Benutzerprofil oder im gemeinsam genutzten Bereich, es sei denn, der Benutzer wählt ein anderes Skript aus der Liste aus, die im Studio Classic-Launcher angezeigt wird. Das Standardskript wird auch ausgeführt, wenn No Script vom Benutzer ausgewählt wird. Weitere Informationen zur Auswahl einer Schrift finden Sie unter Schritt 3: Starten einer Anwendung mit der Lebenszykluskonfiguration.

Timeout für die Lebenszykluskonfiguration

Für die Lebenszykluskonfiguration gilt ein Timeout von 5 Minuten. Wenn die Ausführung eines Skripts für die Lebenszykluskonfiguration länger als 5 Minuten dauert, gibt Studio Classic einen Fehler aus.

Um diesen Fehler zu beheben, stellen Sie sicher, dass Ihr Lebenszykluskonfigurationsskript in weniger als 5 Minuten abgeschlossen ist.

Gehen Sie zum Reduzieren der Laufzeit von Skripten wie folgt vor:

  • Beschränken Sie sich auf notwendige Schritte. Schränken Sie zum Beispiel ein, in welchen conda-Umgebungen große Pakete installiert werden sollen.

  • Führen Sie Aufgaben in parallelen Prozessen aus.

  • Verwenden Sie den nohup Befehl in Ihrem Skript, um sicherzustellen, dass Hangup-Signale ignoriert werden, und um die Ausführung des Skripts nicht zu beenden.