Bereitstellen Ihres Modells - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereitstellen Ihres Modells

Richten Sie auto-scaling und CloudWatch Überwachung für Ihren SageMaker KI-Endpunkt ein, um ihn produktionsbereit zu machen.

Warum Produktionsüberwachung für die Textklassifizierung wichtig ist

Workloads zur Textklassifizierung müssen überwacht werden, weil sie:

  • Erleben Sie wechselnde Datenverkehrsmuster mit Verarbeitungsspitzen.

  • Erfordern Reaktionszeiten von weniger als einer Sekunde.

  • Benötigen Sie Kostenoptimierung durch auto-scaling.

Voraussetzungen

Bevor Sie beginnen, stellen Sie über Folgendes verfügen:

  • Ihr SageMaker KI-Endpunkt, der aus dem vorherigen Abschnitt bereitgestellt wurde.

  • Ihr Endpunktname (zum Beispiel jumpstart-dft-hf-tc).

  • Ihr AWS-Region (zum Beispiel us-east-2).

Informationen zur Erstellung von Endpunkten oder zur Fehlerbehebung finden Sie unter Inferenz in Echtzeit.

Einrichten Ihrer Produktionsüberwachung

Konfigurieren Sie die CloudWatch Überwachung, um die Leistung Ihres Modells in der Produktion zu verfolgen.

  1. Öffnen Sie in Ihrem JupyterLab Bereich das sagemaker_production_monitoring.ipynb Notizbuch aus dem Testpaket, das Sie zuvor hochgeladen haben.

  2. Aktualisieren Sie Ihren Endpunktnamen und Ihre Region im Konfigurationsbereich.

  3. Bitte befolgen Sie die Anweisungen im Notebook, um die Einrichtung durchzuführen:

    • Automatische Skalierung (1—10 Instances basierend auf dem Datenverkehr).

    • CloudWatch Alarme für Latenz- und Aufruf-Schwellenwerte.

    • Metrik-Dashboard für die visuelle Überwachung.

Überprüfen Ihrer Einrichtung

Nachdem Sie die Schritte im Notebook abgeschlossen haben, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Endpunktstatus: InService

  • Automatische Skalierung: 1—10 Instances konfiguriert.

  • CloudWatch Alarme: Überwachung von 2 Alarmen.

  • Metriken: Über 15 registrierte Metriken.

Anmerkung

INSUFFICIENT_DATAAnfangs können Alarme angezeigt werden — das ist normal und ändert sich OK mit der Nutzung.

Überwachen eines Endpunkts

Greifen Sie über die AWS Managementkonsole auf die visuelle Überwachung zu:

Weitere Informationen finden Sie unter Monitor SageMaker AI.

Kosten verwalten und Ressourcen bereinigen

Ihr Monitoring-Setup bietet wertvolle Einblicke in die Produktion, verursacht aber auch fortlaufende AWS Gebühren durch CloudWatch Metriken, Alarme und Richtlinien zur auto-scaling. Für einen kostengünstigen Betrieb ist es wichtig zu wissen, wie diese Kosten verwaltet werden können. Bereinigen Sie die Ressourcen, wenn diese nicht mehr benötigt werden.

Warnung

Für Ihren Endpunkt fallen weiterhin Gebühren an, auch wenn Anfragen nicht bearbeitet werden. Zum Stoppen aller Gebühren müssen Sie Ihren Endpunkt löschen. Anweisungen finden Sie unter Löschen von Endpunkten und Ressourcen.

Erweiterte Überwachungskonfigurationen finden Sie unter CloudWatch Metrics for SageMaker AI.