Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bereitstellen Ihres Modells
Richten Sie auto-scaling und CloudWatch Überwachung für Ihren SageMaker KI-Endpunkt ein, um ihn produktionsbereit zu machen.
Warum Produktionsüberwachung für die Textklassifizierung wichtig ist
Workloads zur Textklassifizierung müssen überwacht werden, weil sie:
Erleben Sie wechselnde Datenverkehrsmuster mit Verarbeitungsspitzen.
Erfordern Reaktionszeiten von weniger als einer Sekunde.
Benötigen Sie Kostenoptimierung durch auto-scaling.
Voraussetzungen
Bevor Sie beginnen, stellen Sie über Folgendes verfügen:
Ihr SageMaker KI-Endpunkt, der aus dem vorherigen Abschnitt bereitgestellt wurde.
Ihr Endpunktname (zum Beispiel jumpstart-dft-hf-tc).
Ihr AWS-Region (zum Beispiel us-east-2).
Einrichten Ihrer Produktionsüberwachung
Konfigurieren Sie die CloudWatch Überwachung, um die Leistung Ihres Modells in der Produktion zu verfolgen.
-
Öffnen Sie in Ihrem JupyterLab Bereich das
sagemaker_production_monitoring.ipynbNotizbuch aus dem Testpaket, das Sie zuvor hochgeladen haben. -
Aktualisieren Sie Ihren Endpunktnamen und Ihre Region im Konfigurationsbereich.
-
Bitte befolgen Sie die Anweisungen im Notebook, um die Einrichtung durchzuführen:
Automatische Skalierung (1—10 Instances basierend auf dem Datenverkehr).
CloudWatch Alarme für Latenz- und Aufruf-Schwellenwerte.
Metrik-Dashboard für die visuelle Überwachung.
Überprüfen Ihrer Einrichtung
Nachdem Sie die Schritte im Notebook abgeschlossen haben, stellen Sie sicher, dass Sie über Folgendes verfügen:
Endpunktstatus:
InServiceAutomatische Skalierung: 1—10 Instances konfiguriert.
CloudWatch Alarme: Überwachung von 2 Alarmen.
Metriken: Über 15 registrierte Metriken.
Anmerkung
INSUFFICIENT_DATAAnfangs können Alarme angezeigt werden — das ist normal und ändert sich OK mit der Nutzung.
Überwachen eines Endpunkts
Greifen Sie über die AWS Managementkonsole auf die visuelle Überwachung zu:
Weitere Informationen finden Sie unter Monitor SageMaker AI.
Kosten verwalten und Ressourcen bereinigen
Ihr Monitoring-Setup bietet wertvolle Einblicke in die Produktion, verursacht aber auch fortlaufende AWS Gebühren durch CloudWatch Metriken, Alarme und Richtlinien zur auto-scaling. Für einen kostengünstigen Betrieb ist es wichtig zu wissen, wie diese Kosten verwaltet werden können. Bereinigen Sie die Ressourcen, wenn diese nicht mehr benötigt werden.
Warnung
Für Ihren Endpunkt fallen weiterhin Gebühren an, auch wenn Anfragen nicht bearbeitet werden. Zum Stoppen aller Gebühren müssen Sie Ihren Endpunkt löschen. Anweisungen finden Sie unter Löschen von Endpunkten und Ressourcen.
Erweiterte Überwachungskonfigurationen finden Sie unter CloudWatch Metrics for SageMaker AI.