

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Surveillez l'inférence `entre le socle et le temps d'exécution à` l'aide de métriques CloudWatch
<a name="monitoring-runtime-metrics"></a>

Le point de `bedrock-runtime.{{region}}.amazonaws.com` terminaison Amazon Bedrock publie les métriques sur Amazon CloudWatch sous l'espace de `AWS/Bedrock` noms. Utilisez ces indicateurs pour surveiller le volume d'appels, la latence, la consommation de jetons, les taux d'erreur et le modèle de livraison de la journalisation des appels.

Si votre application fait appel à l'inférence`bedrock-mantle.{{region}}.api.aws`, consultez [Surveillez l'inférence `entre le substrat rocheux et le manteau à l'aide de métriques` CloudWatch](monitoring-mantle-metrics.md) plutôt.

## Métriques d’exécution Amazon Bedrock
<a name="runtime-cloudwatch-metrics"></a>

Le tableau suivant décrit les métriques d’exécution fournies par Amazon Bedrock.


| Nom de la métrique | Unité | Description | 
| --- | --- | --- | 
| Invocations | SampleCount | Nombre de demandes réussies adressées aux opérations [Converse [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html), [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html), et [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API. | 
| InvocationLatency | MilliSeconds | L'heure entre l'envoi d'une demande et la réception du dernier jeton.<br />Pour distinguer les augmentations de latence causées par les modifications du débit côté service des augmentations causées par des réponses plus longues du modèle, voir. [Diagnostiquez les `InvocationLatency`augmentations à l'aide de jetons de sortie par seconde (OTPS)](monitoring-runtime-otps.md) | 
| InvocationClientErrors | SampleCount | Nombre d’invocations qui entraînent des erreurs côté client. | 
| InvocationServerErrors | SampleCount | Nombre d'appels qui entraînent des erreurs AWS côté serveur. | 
| InvocationThrottles | SampleCount | Nombre d’invocations que le système a limitées. Les demandes limitées et les autres erreurs d’invocation ne comptent pas comme Invocations ou Erreurs. Le nombre de limitations que vous voyez dépendra de vos paramètres de nouvelle tentative dans le kit SDK. Pour plus d'informations, consultez la section [Comportement des tentatives](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html) dans le Guide de référence AWS des SDK et des outils.  | 
| InputTokenCount | SampleCount | Nombre de jetons dans l’entrée. | 
| LegacyModelInvocations | SampleCount | Nombre d’invocations utilisant les modèles [hérités](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_FoundationModelLifecycle.html).  | 
| OutputTokenCount | SampleCount | Nombre de jetons dans la sortie. | 
| OutputImageCount | SampleCount | Nombre d’images dans la sortie (applicable uniquement pour les modèles de génération d’images). | 
| TimeToFirstToken | MilliSeconds | Temps écoulé entre l'envoi d'une demande et la réception du premier jeton, pour les opérations d'API [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)et de [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)streaming. | 
| EstimatedTPMQuotaUsage | SampleCount | Consommation estimée de quotas de jetons par minute (TPM) pour les [opérations Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html), [ConverseStream[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html), et [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API. Cette métrique est une approximation et ne reflète pas la consommation de jetons basée sur les réservations qui détermine les décisions de limitation. La limitation est basée sur la réservation initiale des jetons d'entrée plus `max_tokens` (voir[Mode de comptabilisation des jetons dans Amazon Bedrock](quotas-token-burndown.md)), qui peuvent différer de cette estimation. N'utilisez pas cette métrique comme seul indicateur pour l'utilisation des quotas ou la planification des capacités. | 
| CacheReadInputTokens | SampleCount | Nombre de jetons d'entrée lus dans le [cache d'invite](prompt-caching.md). Ces jetons sont facturés à un taux réduit et ne sont pas pris en compte dans votre quota de TPM. | 
| CacheWriteInputTokens | SampleCount | Nombre de jetons d'entrée écrits dans le [cache d'invite](prompt-caching.md). Ces jetons sont pris en compte dans votre quota TPM. | 

Il existe également des métriques pour les [barrières de protection Amazon Bedrock](monitoring-guardrails-cw-metrics.md) et les [agents Amazon Bedrock](monitoring-agents-cw-metrics.md).

## Métriques de journalisation CloudWatch des invocations du modèle
<a name="br-cloudwatch-metrics"></a>

Pour chaque tentative de livraison réussie ou infructueuse, les CloudWatch métriques Amazon suivantes sont émises sous l'espace de noms `AWS/Bedrock` et la `Across all model IDs` dimension :
+ `ModelInvocationLogsCloudWatchDeliverySuccess`
+ `ModelInvocationLogsCloudWatchDeliveryFailure`
+ `ModelInvocationLogsS3DeliverySuccess`
+ `ModelInvocationLogsS3DeliveryFailure`
+ `ModelInvocationLargeDataS3DeliverySuccess`
+ `ModelInvocationLargeDataS3DeliveryFailure`

Pour générer les métriques relatives à vos opérations Amazon Bedrock, il vous faut spécifier les informations suivantes :
+ La dimension de métrique. Une *dimension* est un ensemble de paires nom-valeur qui vous permet d’identifier une métrique. Amazon Bedrock prend en charge les dimensions suivantes :
  + `ModelId` : toutes les métriques
  + `ModelId + ImageSize + BucketedStepSize` – OutputImageCount
+ Le nom de la métrique, par exemple `InvocationClientErrors`. 

Vous pouvez obtenir des statistiques pour Amazon Bedrock à l'aide de AWS Management Console AWS CLI, de ou de l' CloudWatch API. Vous pouvez utiliser l' CloudWatch API par le biais de l'un des kits de développement AWS logiciel (SDK) ou des outils CloudWatch d'API.

Pour consulter les statistiques d'Amazon Bedrock dans la CloudWatch console, rendez-vous dans la section des statistiques du volet de navigation et sélectionnez l'option Toutes les mesures, puis recherchez l'ID du modèle.

Vous devez disposer des CloudWatch autorisations appropriées pour surveiller Amazon Bedrock. CloudWatch Pour plus d'informations, consultez [Authentification et contrôle d'accès pour Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/auth-and-access-control-cw.html) dans le *guide de l' CloudWatch utilisateur Amazon*.