View a markdown version of this page

Überwachen Sie die Inferenz zwischen Grundmauern und Mänteln mithilfe von Metriken CloudWatch - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen Sie die Inferenz zwischen Grundmauern und Mänteln mithilfe von Metriken CloudWatch

Der Amazon OpenAI-compatible Bedrock-Endpunkt (bedrock-mantle.region.api.aws) veröffentlicht kundenorientierte Kennzahlen CloudWatch unter dem AWS/BedrockMantle Namespace für Amazon. Verwenden Sie diese Metriken, um das Inferenzvolumen, den Token-Verbrauch und die Fehlerquoten in Ihren AWS-Konto Projekten und Modellen zu überwachen.

Wenn Ihre Anwendung Inferenz bedrock-runtime.region.amazonaws.com mithilfe von Converse,, oder InvokeModelWithResponseStreamaufruft ConverseStreamInvokeModel, finden Sie stattdessen weitere Informationen unter. Amazon-Bedrock-Laufzeitmetrik bedrock-mantleDie Metriken beziehen sich nur auf Inferenzen, die über die Responses API, Chat Completions API und Anthropic Messages API auf dem Endpunkt generiert wurden. bedrock-mantle

bedrock-mantleveröffentlicht Metriken auf vier Granularitätsebenen. Jede Ebene verwendet eine andere Kombination von CloudWatch Dimensionen, wie unter beschriebenDimensionen. Alle Metriken beziehen sich auf Ihre. AWS-Konto

Inferenzmetriken

Inferenzmetriken
Metrikname Einheit Description
Inferences Anzahl Gesamtzahl der abgeschlossenen Inferenzanfragen in den APIs „Antworten“, „Chat-Abschlüsse“ und „Nachrichten“. Veröffentlicht auf Konto-, Projekt-, Modell- und Projekt+Modellebene.
InferenceClientErrors Anzahl Anzahl der Inferenzanfragen, bei denen ein clientseitiger Fehler (4xx) aufgetreten ist. Veröffentlicht auf Account-, Projekt-, Model- und Project+Model-Ebene.

Token-Metriken

Token-Metriken
Metrikname Einheit Description
TotalInputTokens Anzahl Aggregiert abrechnungsfähige Eingabe-Token, die innerhalb des Veröffentlichungsintervalls verarbeitet wurden. Veröffentlicht auf Konto-, Projekt- und Modellebene. Wird für Summen und Ratenberechnungen verwendet.
TotalOutputTokens Anzahl Aggregiert abrechnungsfähige Ausgabetokens, die innerhalb des Veröffentlichungsintervalls generiert wurden. Veröffentlicht auf Konto-, Projekt- und Modellebene.
InputTokens Anzahl Per-inference abrechnungsfähige Eingabe-Token. Jede abgeschlossene Inferenz gibt ein Datum aus. Wird nur auf der Ebene Projekt und Modell veröffentlicht. Verwenden Sie diese Option, wenn Sie Perzentilstatistiken (p50/p90/p99) zur Tokenanzahl pro Anfrage benötigen.
OutputTokens Anzahl Per-inference abrechnungsfähige Ausgabetokens. Jede abgeschlossene Inferenz gibt ein Datum aus. Wird nur auf der Ebene Projekt und Modell veröffentlicht.

Dimensionen

Dimensionen
Name der Dimension Werte Gilt für
Project Die Projekt-ID, die der Inferenzanforderung zugeordnet ist. Projekt, Projekt+Modell
Model Die Modell-ID (zum Beispiel). anthropic.claude-opus-4-7 Modell, Projekt+Modell

Account-level Metriken sind auf Ihre Bedürfnisse zugeschnitten AWS-Konto und haben keine zusätzlichen Dimensionen. Jede Granularitätsebene wird unabhängig voneinander ausgegeben, sodass eine einzige Schlussfolgerung zu allen vier Ebenen beiträgt, wenn sowohl das Projekt als auch das Modell gelöst werden können.

Auswahl der richtigen Granularitätsstufe

  • Kontoebene — Gesamtnutzung, Fehlerrate und aggregiertes Token-Volumen. Geeignet für übergeordnete Dashboards und kontoweite Alarme. Nicht für die Kostenanalyse geeignet, da die Preise je nach Modell variieren.

  • Projektebene — Rollups pro Projekt für Chargeback und Dashboards auf Teamebene.

  • Modellebene — Nutzung und Fehlerquoten pro Modell, geeignet für die Migration von Dashboards, die auf der Grundlage der vorhandenen Dimension erstellt wurden. bedrock-runtime ModelId

  • Projektebene und Modellebene — primäre Ebene für die Kostenanalyse sowie die Perzentillatenz und Tokenanalyse. Verwenden Sie diese Option, wenn Sie sowohl die Projektzuweisung als auch die Modellzuweisung für dasselbe Datum benötigen.

Unterschiede zu Basis-Runtime-Metriken

  • Separater Namespace. bedrock-mantleMetriken werden veröffentlicht in. AWS/BedrockMantle Bestehende Dashboards und Alarme, auf deren Grundlage gebaut wurde, AWS/Bedrock nehmen keinen bedrock-mantle Traffic auf.

  • Benennung. bedrock-mantleverwendet Inferences eher alsInvocations, TotalInputTokens und TotalOutputTokens statt InputTokenCount undOutputTokenCount, und InferenceClientErrors eher alsInvocationClientErrors.

  • Dimension des Projekts. bedrock-mantleMetriken haben eine Project Dimension, die bedrock-runtime Metriken nicht haben, sodass die Kosten pro Projekt zugeordnet werden können.

  • Cross-region Folgerung. bedrock-mantleist nur in der Region. Die Metriken werden in der Region ausgegeben, die die Anfrage bearbeitet hat, und werden nicht regionsübergreifend aggregiert, so wie es beim regionenübergreifenden Inferenzverkehr (CRIS) der Fall ist. bedrock-runtime

  • Metriken zur Latenz. InvocationLatencyund TimeToFirstToken Entsprechungen wurden noch nicht von veröffentlicht. bedrock-mantle

Metriken von Grund und Boden anzeigen

So zeigen Sie bedrock-mantle Metriken in der Konsole an: CloudWatch

  1. Öffnen Sie die CloudWatch Konsole.

  2. Wählen Sie im Navigationsbereich Metrics (Metriken) All metrics (Alle Metriken) aus.

  3. Wählen Sie den Namespace AWS/BedrockMantle aus.

  4. Wählen Sie eine Granularitätsebene aus, indem Sie den Dimensionssatz auswählen, der Ihrer Abfrage entspricht (z. B. Project, Model für Projekt- und Modellaufschlüsselungen).

Sie müssen über die entsprechenden CloudWatch Berechtigungen verfügen, um Metriken lesen zu können. bedrock-mantle Weitere Informationen finden Sie unter Authentifizierung und Zugriffskontrolle für Amazon CloudWatch im CloudWatch Amazon-Benutzerhandbuch.