

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Überwachen Sie die `Bedrock-Runtime-Inferenz` mithilfe von Metriken CloudWatch
<a name="monitoring-runtime-metrics"></a>

Der Amazon `bedrock-runtime.{{region}}.amazonaws.com` Bedrock-Endpunkt veröffentlicht Metriken für Amazon CloudWatch unter dem `AWS/Bedrock` Namespace. Verwenden Sie diese Metriken, um das Aufrufvolumen, die Latenz, den Token-Verbrauch und die Fehlerraten zu überwachen und die Bereitstellung der Aufrufprotokollierung zu modellieren.

Wenn Ihre Anwendung Inference Through aufruft, finden Sie stattdessen weitere Informationen `bedrock-mantle.{{region}}.api.aws` unter. [Überwachen Sie die `Inferenz zwischen Grundmauern und Mänteln mithilfe von Metriken` CloudWatch](monitoring-mantle-metrics.md)

## Amazon-Bedrock-Laufzeitmetrik
<a name="runtime-cloudwatch-metrics"></a>

In der folgenden Tabelle werden die von Amazon Bedrock bereitgestellten Laufzeitmetriken beschrieben.


| Metrikname | Einheit | Description | 
| --- | --- | --- | 
| Aufrufe | SampleCount | Anzahl der erfolgreichen Anfragen an die [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) -, [ConverseStream[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html), und [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API-Operationen. | 
| InvocationLatency | MilliSeconds | Die Zeit vom Senden einer Anfrage bis zum Empfang des letzten Tokens.<br />Informationen zur Unterscheidung von Latenzerhöhungen, die durch Änderungen des dienstseitigen Durchsatzes verursacht werden, und Zunahmen aufgrund längerer Modellantworten finden Sie unter[Diagnostizieren Sie `InvocationLatency`Zunahmen mithilfe von Output-Token pro Sekunde (OTPS)](monitoring-runtime-otps.md). | 
| InvocationClientErrors | SampleCount | Anzahl der Aufrufe, die zu clientseitigen Fehlern führen | 
| InvocationServerErrors | SampleCount | Anzahl der Aufrufe, die zu serverseitigen Fehlern führen. AWS  | 
| InvocationThrottles | SampleCount | Anzahl der Aufrufe, die das System gedrosselt hat Gedrosselte Anforderungen und andere Aufruffehler zählen nicht als Aufrufe oder Fehler. Die Anzahl der Drosselungen, die Sie sehen, hängt von den Wiederholungseinstellungen im SDK ab. Weitere Informationen finden Sie unter [Verhalten bei Wiederholungsversuchen](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html) im Referenzhandbuch für AWS SDKs und Tools.  | 
| InputTokenCount | SampleCount | Anzahl von Token in der Eingabe | 
| LegacyModelInvocations | SampleCount | Anzahl der Aufrufe mit [Legacy](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_FoundationModelLifecycle.html)-Modellen  | 
| OutputTokenCount | SampleCount | Anzahl von Token in der Ausgabe | 
| OutputImageCount | SampleCount | Anzahl der Bilder in der Ausgabe (gilt nur für Modelle zur Bildgenerierung). | 
| TimeToFirstToken | MilliSeconds | Zeit vom Senden einer Anfrage bis zum Empfang des ersten Tokens für die [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)und die [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)Streaming-API-Operationen. | 
| EstimatedTPMQuotaUsage | SampleCount | Geschätzter Verbrauch von Tokens pro Minute (TPM) für die [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) -, [ConverseStream[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html),- und [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API-Operationen. Diese Kennzahl ist eine Näherung und spiegelt nicht den auf Reservierungen basierenden Token-Verbrauch wider, der zu Drosselungsentscheidungen führt. Die Drosselung basiert auf der Vorausbuchung von Eingabe-Token plus `max_tokens` (siehe[So werden Token in Amazon Bedrock gezählt](quotas-token-burndown.md)), die von dieser Schätzung abweichen kann. Verwenden Sie diese Kennzahl nicht als einzigen Indikator für die Quotennutzung oder Kapazitätsplanung. | 
| CacheReadInputTokens | SampleCount | Anzahl der aus dem [Prompt-Cache](prompt-caching.md) gelesenen Eingabe-Tokens. Diese Token werden zu einem reduzierten Preis berechnet und nicht auf Ihr TPM-Kontingent angerechnet. | 
| CacheWriteInputTokens | SampleCount | Anzahl der Eingabetoken, die in den [Prompt-Cache](prompt-caching.md) geschrieben wurden. Diese Token werden auf Ihr TPM-Kontingent angerechnet. | 

Es gibt auch Metriken für den [Integritätsschutz für Amazon Bedrock](monitoring-guardrails-cw-metrics.md) und [Agenten für Amazon Bedrock](monitoring-agents-cw-metrics.md).

## Modellieren Sie Messwerte zur Protokollierung von Aufrufen CloudWatch
<a name="br-cloudwatch-metrics"></a>

Für jeden erfolgreichen oder fehlgeschlagenen Zustellversuch werden die folgenden CloudWatch Amazon-Metriken unter dem Namespace `AWS/Bedrock` und der `Across all model IDs` Dimension ausgegeben:
+ `ModelInvocationLogsCloudWatchDeliverySuccess`
+ `ModelInvocationLogsCloudWatchDeliveryFailure`
+ `ModelInvocationLogsS3DeliverySuccess`
+ `ModelInvocationLogsS3DeliveryFailure`
+ `ModelInvocationLargeDataS3DeliverySuccess`
+ `ModelInvocationLargeDataS3DeliveryFailure`

Geben Sie die folgenden Informationen an, um Metriken für Amazon–Bedrock-Operationen abzurufen:
+ Die Metrikdimension. Eine *Dimension* bezeichnet eine Reihe von Name-Wert-Paaren, mit denen eine Metrik eindeutig identifiziert wird. Amazon Bedrock unterstützt die folgenden Dimensionen:
  + `ModelId` – alle Metriken
  + `ModelId + ImageSize + BucketedStepSize` – OutputImageCount
+ Der Metrikname, beispielsweise `InvocationClientErrors`. 

Sie können Metriken für Amazon Bedrock mit der AWS-Managementkonsole AWS CLI, der oder der CloudWatch API abrufen. Sie können die CloudWatch API über eines der AWS Software Development Kits (SDKs) oder die CloudWatch API-Tools verwenden.

Um Amazon Bedrock-Metriken in der CloudWatch Konsole anzuzeigen, gehen Sie zum Abschnitt Metriken im Navigationsbereich, wählen Sie die Option Alle Metriken aus und suchen Sie dann nach der Modell-ID.

Sie müssen über die entsprechenden CloudWatch Berechtigungen verfügen, um Amazon Bedrock mit überwachen zu können. CloudWatch Weitere Informationen finden Sie unter [Authentifizierung und Zugriffskontrolle für Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/auth-and-access-control-cw.html) *im CloudWatch Amazon-Benutzerhandbuch*.