Erweiterte Metriken aktivieren Instance-level Nutzungsmetriken Aufrufmetriken auf Instanz- und Containerebene Container-level Nutzungsmetriken Konfigurierbare metrische Frequenz Codebeispiele: Konfigurieren Sie erweiterte Metriken

Verbesserte Amazon SageMaker AI-Metriken für Inferenzendpunkte

Verbesserte Metriken bieten Überwachungsdaten auf Instance- und Container-Ebene für Amazon SageMaker AI-Echtzeit-Endpunkte. Wenn Sie erweiterte Metriken aktivieren, können CloudWatch Amazon-Metriken AcceleratorId Dimensionen und Dimensionen (Verfügbarkeit variiert je nach Namespace) beinhalten InstanceIdContainerId, um eine detaillierte Sichtbarkeit pro Instance, pro Container und pro GPU zu gewährleisten. Erweiterte Metriken sind für Einzelmodell-Endpunkte und Inferenzkomponenten verfügbar. Multi-Container Endpoints (MCE) unterstützen erweiterte Metriken auf Instanzebene, aber keine Metriken auf Container-Ebene.

Hauptmerkmale erweiterter Metriken:

Instance-level Granularität. Die Nutzungs- und Aufrufmetriken beinhalten eine InstanceId Dimension, die die spezifische Instanz identifiziert, die den Endpunkt hostet. Dies ist für alle Echtzeit-Endpunkte verfügbar.
Container-level Granularität. Bei Endpunkten, die Inferenzkomponenten verwenden, enthalten die Metriken eine ContainerId Dimension, die den spezifischen Container identifiziert, auf dem das Modell ausgeführt wird. Container-level Dimensionen erscheinen sowohl im AWS/SageMaker Namespace (Aufrufmetriken) als auch im /aws/sagemaker/InferenceComponents Namespace (Nutzungsmetriken).
Per-GPU Granularität. Zu den GPU-Nutzungsmetriken gehört eine AcceleratorId Dimension, die die spezifische GPU auf einer Instance identifiziert.
Konfigurierbare Veröffentlichungshäufigkeit. Sie können das Intervall für die Veröffentlichung von Metriken auf 10, 30, 60, 120, 180, 240 oder 300 Sekunden konfigurieren. Standardmäßig ist ein Zeitraum von 60 Sekunden festgelegt. Dieses Intervall gilt für Nutzungsmetriken, unabhängig davon, ob erweiterte Metriken aktiviert sind. Wenn erweiterte Metriken aktiviert sind, gilt es auch für Aufrufmetriken.

Erweiterte Metriken aktivieren

Sie aktivieren erweiterte MetrikenEnableEnhancedMetrics, True indem Sie beim Aufruf der CreateEndpointConfigAPI den MetricsConfigParameter auf einstellen.

Der MetricsConfig Parameter hat die folgenden Felder:

MetricsConfig Parameter
Parameter	Typ	Erforderlich	Standard	Description
`EnableEnhancedMetrics`	Boolesch	Nein	`False`	Ermöglicht metrische Dimensionen auf Instance- und Container-Ebene.
`MetricPublishFrequencyInSeconds`	Ganzzahl	Nein	`60`	Das Intervall in Sekunden, in dem Metriken auf Amazon veröffentlicht werden CloudWatch. Standardeinstellung: `60`. Gültige Werte: `1030`,`60`,`120`,`180`,`240`,`300`. Wenn auf gesetzt `EnableEnhancedMetrics` ist`False`, gilt dieses Intervall nur für Nutzungsmetriken. Aufrufmetriken werden weiterhin im Standardintervall von 60 Sekunden veröffentlicht. Wenn auf gesetzt`True`, gilt dieses Intervall sowohl für Nutzungs- als auch für Aufrufmetriken.

Anmerkung

MetricsConfigist auf der Endpunktkonfigurationsebene festgelegt. Sie können keine unterschiedlichen Einstellungen für einzelne Inferenzkomponenten auf demselben Endpunkt konfigurieren.

Um erweiterte Metriken auf einem vorhandenen Endpunkt zu aktivieren, erstellen Sie eine neue Endpunktkonfiguration mit den gewünschten MetricsConfig Einstellungen und rufen Sie dann UpdateEndpointmit dem neuen Namen der Endpunktkonfiguration auf. Dies löst eine blue/green oder fortlaufende Bereitstellung aus. Verbesserte Messwerte werden erst angezeigt, wenn die Bereitstellung abgeschlossen ist. Derselbe Vorgang gilt, wenn MetricsConfig Einstellungen auf einem bereits konfigurierten Endpunkt geändert werden.

Wenn Sie beides konfigurieren MetricsConfig DescribeEndpointund MetricsConfig in der DescribeEndpointConfigAntwort zurückkehren.

Wenn Sie erweiterte Metriken aktivieren, fügt SageMaker KI den Metriken in drei CloudWatch Namespaces zusätzliche Dimensionen hinzu: /aws/sagemaker/Endpoints für Nutzungsmetriken, für Aufrufmetriken und AWS/SageMaker /aws/sagemaker/InferenceComponents für Nutzungsmetriken von Inferenzkomponenten.

Instance-level Nutzungsmetriken

Der /aws/sagemaker/Endpoints Namespace umfasst Nutzungsmetriken für alle Echtzeit-Endpunkte, einschließlich solcher, die Inferenzkomponenten verwenden. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen InstanceId und AcceleratorId (nur GPU-Metriken) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unterSageMaker KI-Endpunktmetriken.

Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:

Zusätzliche Dimensionen für Nutzungsmetriken auf Instanzebene
Dimension	Description
`InstanceId`	Filtert Nutzungsmetriken für eine bestimmte Instanz.
`AcceleratorId`	(Nur GPU-Metriken) Filtert Nutzungsmetriken für eine bestimmte GPU.

Aufrufmetriken auf Instanz- und Containerebene

Der AWS/SageMaker Namespace umfasst Aufrufmetriken. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen InstanceId und ContainerId (nur Inferenzkomponenten) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unter. SageMaker Metriken zum Aufrufen von KI-Endpunkten

Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:

Zusätzliche Dimensionen für Aufrufmetriken
Dimension	Description
`InstanceId`	Filtert Aufrufmetriken für eine bestimmte Instanz.
`ContainerId`	(Nur Inferenzkomponenten) Filtert Aufrufmetriken für einen bestimmten Container.

Container-level Nutzungsmetriken

Der /aws/sagemaker/InferenceComponents Namespace umfasst Nutzungsmetriken für Endpunkte, die Inferenzkomponenten verwenden. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen InstanceIdContainerId, und AcceleratorId (nur GPU-Metriken) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unterSageMaker Metriken für KI-Inferenzkomponenten.

Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:

Zusätzliche Dimensionen für Nutzungsmetriken auf Containerebene
Dimension	Description
`InstanceId`	Filtert Nutzungsmetriken für eine bestimmte Instanz.
`ContainerId`	Filtert Nutzungsmetriken für einen bestimmten Container.
`AcceleratorId`	(Nur GPU-Metriken) Filtert Nutzungsmetriken für eine bestimmte GPU.

Konfigurierbare metrische Frequenz

Sie können das Intervall konfigurieren, in dem Metriken veröffentlicht werden CloudWatch. Die Standardfrequenz beträgt 60 Sekunden.

Gültige Werte: 10, 30, 60, 120, 180, 240 oder 300 Sekunden.

Wenn auf eingestellt EnableEnhancedMetrics istFalse, gilt diese Häufigkeit nur für Nutzungsmetriken. Aufrufmetriken werden weiterhin im Standardintervall von 60 Sekunden veröffentlicht. Wenn auf gesetztTrue, gilt diese Frequenz sowohl für Nutzungs- als auch für Aufrufmetriken.

Anmerkung

Metriken, die in Intervallen von weniger als 60 Sekunden veröffentlicht werden (hohe Auflösung), werden 3 Stunden lang aufbewahrt.

CloudWatch Die Standardpreise gelten pro Metrik pro eindeutiger Dimensionskombination. Verbesserte Metriken erhöhen die Anzahl der Metrik-Streams, da jede Instance, jeder Container und jede GPU zusätzliche Dimensionskombinationen erstellt. Preisdetails finden Sie unter CloudWatch Amazon-Preise.

Codebeispiele: Konfigurieren Sie erweiterte Metriken

Die folgenden Beispiele zeigen, wie Sie eine Endpunktkonfiguration mit aktivierten erweiterten Metriken erstellen und wie die Konfiguration überprüft wird.

Erstellen Sie eine Endpunktkonfiguration mit erweiterten Metriken

Überprüfen Sie die Konfiguration der erweiterten Metriken

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Metriken in CloudWatch

Detaillierte Beobachtbarkeit

Verbesserte Amazon SageMaker AI-Metriken für Inferenzendpunkte

Erweiterte Metriken aktivieren

Anmerkung

Instance-level Nutzungsmetriken

Aufrufmetriken auf Instanz- und Containerebene

Container-level Nutzungsmetriken

Konfigurierbare metrische Frequenz

Anmerkung

Codebeispiele: Konfigurieren Sie erweiterte Metriken

Erstellen Sie eine Endpunktkonfiguration mit erweiterten Metriken

Beispiel Erstellen Sie eine Endpunktkonfiguration mit erweiterten Metriken

Beispiel Erstellen Sie eine Endpunktkonfiguration mit erweiterten Metriken

Überprüfen Sie die Konfiguration der erweiterten Metriken

BeispielÜberprüfen Sie die Konfiguration der erweiterten Metriken

BeispielÜberprüfen Sie die Konfiguration der erweiterten Metriken