Konfigurationen für den Debug-Lebenszyklus - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Konfigurationen für den Debug-Lebenszyklus

In den folgenden Themen erfahren Sie, wie Sie Informationen über Ihre Lebenszykluskonfigurationen abrufen und debuggen.

Überprüfen Sie den Prozess der Lebenszykluskonfiguration anhand der CloudWatch Protokolle

Lebenszykluskonfigurationen protokollieren nur STDOUT und STDERR.

STDOUT ist die Standardausgabe für Bash-Skripte. Sie können in STDERR schreiben, indem Sie >&2 an das Ende eines Bash-Befehls anhängen. Beispiel, echo 'hello'>&2.

Protokolle für Ihre Lebenszykluskonfigurationen werden auf Amazon veröffentlicht, wenn Sie Amazon AWS-Konto verwenden CloudWatch. Diese Protokolle finden Sie im /aws/sagemaker/studio Protokollstream in der CloudWatch Konsole.

  1. Öffnen Sie die CloudWatch Konsole unter https://console.aws.amazon.com/cloudwatch/.

  2. Wählen Sie im linken Navigationsbereich Logs aus. Wählen Sie im Dropdown-Menü Protokollgruppen aus.

  3. Suchen Sie auf der Seite Protokollgruppen nach aws/sagemaker/studio.

  4. Wählen Sie die -Protokollgruppe aus.

  5. Wählen Sie auf der Seite mit den Details zur Protokollgruppe die Registerkarte Protokollstreams aus.

  6. Um die Protokolle für einen bestimmten Bereich zu finden, durchsuchen Sie die Protokolldatenströme im folgenden Format:

    domain-id/space-name/app-type/default/LifecycleConfigOnStart

    Verwenden Sie beispielsweise die folgende Suchzeichenfolge, um die Lebenszykluskonfigurationsprotokolle für Domain-ID d-m85lcu8vbqmzi-sonic-js, Space-Name und Anwendungstyp JupyterLab zu finden:

    d-m85lcu8vbqmz/i-sonic-js/JupyterLab/default/LifecycleConfigOnStart

Timeout für die Lebenszykluskonfiguration

Für die Lebenszykluskonfiguration gilt ein Timeout von 5 Minuten. Wenn die Ausführung eines Lebenszykluskonfigurationsskripts länger als 5 Minuten dauert, wird eine Fehlermeldung angezeigt.

Um diesen Fehler zu beheben, stellen Sie sicher, dass Ihr Lebenszyklus-Konfigurationsskript in weniger als 5 Minuten abgeschlossen ist.

Versuchen Sie Folgendes, um die Laufzeit von Skripten zu verringern:

  • Reduzieren Sie unnötige Schritte. Schränken Sie zum Beispiel ein, in welchen conda-Umgebungen große Pakete installiert werden sollen.

  • Führen Sie Aufgaben in parallelen Prozessen aus.

  • Verwenden Sie den Befehl nohup in Ihrem Skript, um sicherzustellen, dass Aufhängesignale ignoriert werden, sodass das Skript ohne Unterbrechung ausgeführt wird.