Warum Produktionsüberwachung für die Textklassifizierung wichtig ist Voraussetzungen Einrichten Ihrer Produktionsüberwachung Überprüfen Ihrer Einrichtung Überwachen eines Endpunkts Kosten verwalten und Ressourcen bereinigen

Bereitstellen Ihres Modells

Richten Sie auto-scaling und CloudWatch Überwachung für Ihren SageMaker KI-Endpunkt ein, um ihn produktionsbereit zu machen.

Warum Produktionsüberwachung für die Textklassifizierung wichtig ist

Workloads zur Textklassifizierung müssen überwacht werden, weil sie:

Erleben Sie wechselnde Datenverkehrsmuster mit Verarbeitungsspitzen.
Erfordern Reaktionszeiten von weniger als einer Sekunde.
Benötigen Sie Kostenoptimierung durch auto-scaling.

Voraussetzungen

Bevor Sie beginnen, stellen Sie über Folgendes verfügen:

Ihr SageMaker KI-Endpunkt, der aus dem vorherigen Abschnitt bereitgestellt wurde.
Ihr Endpunktname (zum Beispiel jumpstart-dft-hf-tc).
Ihr AWS-Region (zum Beispiel us-east-2).

Informationen zur Erstellung von Endpunkten oder zur Fehlerbehebung finden Sie unter Inferenz in Echtzeit.

Einrichten Ihrer Produktionsüberwachung

Konfigurieren Sie die CloudWatch Überwachung, um die Leistung Ihres Modells in der Produktion zu verfolgen.

Öffnen Sie in Ihrem JupyterLab Bereich das sagemaker_production_monitoring.ipynb Notizbuch aus dem Testpaket, das Sie zuvor hochgeladen haben.
Aktualisieren Sie Ihren Endpunktnamen und Ihre Region im Konfigurationsbereich.
Bitte befolgen Sie die Anweisungen im Notebook, um die Einrichtung durchzuführen:
- Automatische Skalierung (1 –10 Instances basierend auf dem Datenverkehr).
- CloudWatch Alarme für Latenz- und Aufruf-Schwellenwerte.
- Metrik-Dashboard für die visuelle Überwachung.

Überprüfen Ihrer Einrichtung

Nachdem Sie die Schritte im Notebook abgeschlossen haben, stellen Sie sicher, dass Sie über Folgendes verfügen:

Endpunktstatus: InService
Automatische Skalierung: 1 –10 Instances konfiguriert.
CloudWatch Alarme: Überwachung von 2 Alarmen.
Metriken: Über 15 registrierte Metriken.

Anmerkung

INSUFFICIENT_DATAAnfangs können Alarme angezeigt werden – das ist normal und ändert sich OK mit der Nutzung.

Überwachen eines Endpunkts

Greifen Sie über die AWS Managementkonsole auf die visuelle Überwachung zu:

Weitere Informationen finden Sie unter Monitor SageMaker AI.

Kosten verwalten und Ressourcen bereinigen

Ihr Monitoring-Setup bietet wertvolle Einblicke in die Produktion, verursacht aber auch fortlaufende AWS Gebühren durch CloudWatch Metriken, Alarme und Richtlinien zur auto-scaling. Für einen kostengünstigen Betrieb ist es wichtig zu wissen, wie diese Kosten verwaltet werden können. Bereinigen Sie die Ressourcen, wenn diese nicht mehr benötigt werden.

Warnung

Für Ihren Endpunkt fallen weiterhin Gebühren an, auch wenn Anfragen nicht bearbeitet werden. Zum Stoppen aller Gebühren müssen Sie Ihren Endpunkt löschen. Anweisungen finden Sie unter Löschen von Endpunkten und Ressourcen.

Erweiterte Überwachungskonfigurationen finden Sie unter CloudWatch Metrics for SageMaker AI.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Interpretieren Ihrer Ergebnisse

Fairness und Erklärbarkeit