Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verbesserte Amazon SageMaker AI-Metriken für Inferenzendpunkte
Verbesserte Metriken bieten Überwachungsdaten auf Instance- und Container-Ebene für Amazon SageMaker AI-Echtzeit-Endpunkte. Wenn Sie erweiterte Metriken aktivieren, können CloudWatch Amazon-Metriken AcceleratorId Dimensionen und Dimensionen (Verfügbarkeit variiert je nach Namespace) beinhalten InstanceIdContainerId, um eine detaillierte Sichtbarkeit pro Instance, pro Container und pro GPU zu gewährleisten. Erweiterte Metriken sind für Einzelmodell-Endpunkte und Inferenzkomponenten verfügbar. Multi-Container Endpoints (MCE) unterstützen erweiterte Metriken auf Instanzebene, aber keine Metriken auf Container-Ebene.
Hauptmerkmale erweiterter Metriken:
-
Instance-level Granularität. Die Nutzungs- und Aufrufmetriken beinhalten eine
InstanceIdDimension, die die spezifische Instanz identifiziert, die den Endpunkt hostet. Dies ist für alle Echtzeit-Endpunkte verfügbar. -
Container-level Granularität. Bei Endpunkten, die Inferenzkomponenten verwenden, enthalten die Metriken eine
ContainerIdDimension, die den spezifischen Container identifiziert, auf dem das Modell ausgeführt wird. Container-level Dimensionen erscheinen sowohl imAWS/SageMakerNamespace (Aufrufmetriken) als auch im/aws/sagemaker/InferenceComponentsNamespace (Nutzungsmetriken). -
Per-GPU Granularität. Zu den GPU-Nutzungsmetriken gehört eine
AcceleratorIdDimension, die die spezifische GPU auf einer Instance identifiziert. -
Konfigurierbare Veröffentlichungshäufigkeit. Sie können das Intervall für die Veröffentlichung von Metriken auf 10, 30, 60, 120, 180, 240 oder 300 Sekunden konfigurieren. Standardmäßig ist ein Zeitraum von 60 Sekunden festgelegt. Dieses Intervall gilt für Nutzungsmetriken, unabhängig davon, ob erweiterte Metriken aktiviert sind. Wenn erweiterte Metriken aktiviert sind, gilt es auch für Aufrufmetriken.
Erweiterte Metriken aktivieren
Sie aktivieren erweiterte MetrikenEnableEnhancedMetrics, True indem Sie beim Aufruf der CreateEndpointConfigAPI den MetricsConfigParameter auf einstellen.
Der MetricsConfig Parameter hat die folgenden Felder:
| Parameter | Typ | Erforderlich | Standard | Description |
|---|---|---|---|---|
EnableEnhancedMetrics |
Boolesch | Nein | False |
Ermöglicht metrische Dimensionen auf Instance- und Container-Ebene. |
MetricPublishFrequencyInSeconds |
Ganzzahl | Nein | 60 |
Das Intervall in Sekunden, in dem Metriken auf Amazon veröffentlicht werden CloudWatch. Standardeinstellung: |
Anmerkung
MetricsConfigist auf der Endpunktkonfigurationsebene festgelegt. Sie können keine unterschiedlichen Einstellungen für einzelne Inferenzkomponenten auf demselben Endpunkt konfigurieren.
Um erweiterte Metriken auf einem vorhandenen Endpunkt zu aktivieren, erstellen Sie eine neue Endpunktkonfiguration mit den gewünschten MetricsConfig Einstellungen und rufen Sie dann UpdateEndpointmit dem neuen Namen der Endpunktkonfiguration auf. Dies löst eine blue/green oder fortlaufende Bereitstellung aus. Verbesserte Messwerte werden erst angezeigt, wenn die Bereitstellung abgeschlossen ist. Derselbe Vorgang gilt, wenn MetricsConfig Einstellungen auf einem bereits konfigurierten Endpunkt geändert werden.
Wenn Sie beides konfigurieren MetricsConfig DescribeEndpointund MetricsConfig in der DescribeEndpointConfigAntwort zurückkehren.
Wenn Sie erweiterte Metriken aktivieren, fügt SageMaker KI den Metriken in drei CloudWatch Namespaces zusätzliche Dimensionen hinzu: /aws/sagemaker/Endpoints für Nutzungsmetriken, für Aufrufmetriken und AWS/SageMaker /aws/sagemaker/InferenceComponents für Nutzungsmetriken von Inferenzkomponenten.
Instance-level Nutzungsmetriken
Der /aws/sagemaker/Endpoints Namespace umfasst Nutzungsmetriken für alle Echtzeit-Endpunkte, einschließlich solcher, die Inferenzkomponenten verwenden. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen InstanceId und AcceleratorId (nur GPU-Metriken) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unterSageMaker KI-Endpunktmetriken.
Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:
| Dimension | Description |
|---|---|
InstanceId |
Filtert Nutzungsmetriken für eine bestimmte Instanz. |
AcceleratorId |
(Nur GPU-Metriken) Filtert Nutzungsmetriken für eine bestimmte GPU. |
Aufrufmetriken auf Instanz- und Containerebene
Der AWS/SageMaker Namespace umfasst Aufrufmetriken. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen InstanceId und ContainerId (nur Inferenzkomponenten) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unter. SageMaker Metriken zum Aufrufen von KI-Endpunkten
Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:
| Dimension | Description |
|---|---|
InstanceId |
Filtert Aufrufmetriken für eine bestimmte Instanz. |
ContainerId |
(Nur Inferenzkomponenten) Filtert Aufrufmetriken für einen bestimmten Container. |
Container-level Nutzungsmetriken
Der /aws/sagemaker/InferenceComponents Namespace umfasst Nutzungsmetriken für Endpunkte, die Inferenzkomponenten verwenden. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen InstanceIdContainerId, und AcceleratorId (nur GPU-Metriken) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unterSageMaker Metriken für KI-Inferenzkomponenten.
Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:
| Dimension | Description |
|---|---|
InstanceId |
Filtert Nutzungsmetriken für eine bestimmte Instanz. |
ContainerId |
Filtert Nutzungsmetriken für einen bestimmten Container. |
AcceleratorId |
(Nur GPU-Metriken) Filtert Nutzungsmetriken für eine bestimmte GPU. |
Konfigurierbare metrische Frequenz
Sie können das Intervall konfigurieren, in dem Metriken veröffentlicht werden CloudWatch. Die Standardfrequenz beträgt 60 Sekunden.
Gültige Werte: 10, 30, 60, 120, 180, 240 oder 300 Sekunden.
Wenn auf eingestellt EnableEnhancedMetrics istFalse, gilt diese Häufigkeit nur für Nutzungsmetriken. Aufrufmetriken werden weiterhin im Standardintervall von 60 Sekunden veröffentlicht. Wenn auf gesetztTrue, gilt diese Frequenz sowohl für Nutzungs- als auch für Aufrufmetriken.
Anmerkung
Metriken, die in Intervallen von weniger als 60 Sekunden veröffentlicht werden (hohe Auflösung), werden 3 Stunden lang aufbewahrt.
CloudWatch Die Standardpreise gelten pro Metrik pro eindeutiger Dimensionskombination. Verbesserte Metriken erhöhen die Anzahl der Metrik-Streams, da jede Instance, jeder Container und jede GPU zusätzliche Dimensionskombinationen erstellt. Preisdetails finden Sie unter CloudWatch Amazon-Preise
Codebeispiele: Konfigurieren Sie erweiterte Metriken
Die folgenden Beispiele zeigen, wie Sie eine Endpunktkonfiguration mit aktivierten erweiterten Metriken erstellen und wie die Konfiguration überprüft wird.