Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Beobachtbarkeit
Standardmäßige Kubernetes-Überwachung
Sie können Spaces mit Standard-Kubernetes-Tools wie kubectl Describe und Logs überwachen. kubectl
Den Space-Status überwachen
# List all Spaces with status kubectl get workspace -A # Get detailed information about a specific Space kubectl describe workspace <workspace-name>
Speicherprotokolle anzeigen
# View workspace container logs kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace # View SSM agent sidecar logs (for remote IDE connectivity) kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c ssm-agent-sidecar # Follow logs in real-time kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace -f
Weltraumbedingungen verstehen
Räume geben in ihrem Status vier Zustandstypen an:
-
Verfügbar:
Truewenn der Space einsatzbereit ist. Alle erforderlichen Ressourcen (Pods, Dienste, Speicher) laufen und funktionieren einwandfrei. -
Fortschreitend:
Truewenn der Space erstellt, aktualisiert oder abgeglichen wird. Wechselt zu einem Zustand, derFalseeinmal stabil ist. -
Heruntergestuft:
Truewenn Fehler bei den Space-Ressourcen festgestellt werden. Einzelheiten finden Sie in der Zustandsmeldung. -
Gestoppt:
Truewenn der Status Speicherplatz gewünscht auf gesetzt istStopped. Die Pods werden beendet, aber Speicher und Konfiguration bleiben erhalten.
CloudWatch Protokolliert die Integration
Sie können das CloudWatch Logging-Add-on installieren, um Space-Logs zur zentralen Protokollverwaltung und Aufbewahrung an Amazon CloudWatch Logs zu senden. Dies ermöglicht die Aggregation von Protokollen über mehrere Cluster hinweg und die Integration mit CloudWatch Insights für Abfragen und Analysen. Alle oben genannten verfügbaren kubectl Protokolle können mit diesem Plugin abgefragt werden. CloudWatch
Referenz: https://docs.aws.amazon.com/sagemaker/ latest/dg/sagemaker- hyperpod-eks-cluster-observability - cluster-cloudwatch-ci .html.
HyperPod Add-on „Beobachtbarkeit“
Das SageMaker HyperPod Observability-Add-on bietet umfassende Dashboards zur Überwachung der Nutzung von Weltraumressourcen. Nach der Installation des Add-ons können Sie die Speicherplatz-, Speicher- und CPU-Auslastung auf der Registerkarte Aufgaben der HyperPod Konsole einsehen, die Metriken in Amazon Managed Grafana-Dashboards anzeigt.
Verfügbare Schlüsselmetriken:
-
CPU- und Speicherauslastung pro Speicherplatz
-
GPU-Metriken (falls zutreffend)