Beobachtbarkeit - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Beobachtbarkeit

Standardmäßige Kubernetes-Überwachung

Sie können Spaces mit Standard-Kubernetes-Tools wie kubectl Describe und Logs überwachen. kubectl

Den Space-Status überwachen

# List all Spaces with status kubectl get workspace -A # Get detailed information about a specific Space kubectl describe workspace <workspace-name>

Speicherprotokolle anzeigen

# View workspace container logs kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace # View SSM agent sidecar logs (for remote IDE connectivity) kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c ssm-agent-sidecar # Follow logs in real-time kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace -f

Weltraumbedingungen verstehen

Räume geben in ihrem Status vier Zustandstypen an:

  • Verfügbar: True wenn der Space einsatzbereit ist. Alle erforderlichen Ressourcen (Pods, Dienste, Speicher) laufen und funktionieren einwandfrei.

  • Fortschreitend: True wenn der Space erstellt, aktualisiert oder abgeglichen wird. Wechselt zu einem Zustand, der False einmal stabil ist.

  • Heruntergestuft: True wenn Fehler bei den Space-Ressourcen festgestellt werden. Einzelheiten finden Sie in der Zustandsmeldung.

  • Gestoppt: True wenn der Status Speicherplatz gewünscht auf gesetzt istStopped. Die Pods werden beendet, aber Speicher und Konfiguration bleiben erhalten.

CloudWatch Protokolliert die Integration

Sie können das CloudWatch Logging-Add-on installieren, um Space-Logs zur zentralen Protokollverwaltung und Aufbewahrung an Amazon CloudWatch Logs zu senden. Dies ermöglicht die Aggregation von Protokollen über mehrere Cluster hinweg und die Integration mit CloudWatch Insights für Abfragen und Analysen. Alle oben genannten verfügbaren kubectl Protokolle können mit diesem Plugin abgefragt werden. CloudWatch

Referenz: https://docs.aws.amazon.com/sagemaker/ latest/dg/sagemaker- hyperpod-eks-cluster-observability - cluster-cloudwatch-ci .html.

HyperPod Add-on „Beobachtbarkeit“

Das SageMaker HyperPod Observability-Add-on bietet umfassende Dashboards zur Überwachung der Nutzung von Weltraumressourcen. Nach der Installation des Add-ons können Sie die Speicherplatz-, Speicher- und CPU-Auslastung auf der Registerkarte Aufgaben der HyperPod Konsole einsehen, die Metriken in Amazon Managed Grafana-Dashboards anzeigt.

Referenz: .html https://docs.aws.amazon.com/sagemaker/ latest/dg/sagemaker hyperpod-observability-addon

Verfügbare Schlüsselmetriken:

  • CPU- und Speicherauslastung pro Speicherplatz

  • GPU-Metriken (falls zutreffend)