

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Monitora l'`inferenza base-runtime utilizzando` le metriche CloudWatch
<a name="monitoring-runtime-metrics"></a>

L'`bedrock-runtime.{{region}}.amazonaws.com`endpoint Amazon Bedrock pubblica i parametri su CloudWatch Amazon nel namespace. `AWS/Bedrock` Utilizza queste metriche per monitorare il volume delle chiamate, la latenza, il consumo di token, i tassi di errore e la distribuzione dei log delle invocazioni dei modelli.

Se la tua applicazione richiede l'inferenza, vedi invece. `bedrock-mantle.{{region}}.api.aws` [Monitora l'`inferenza tra basamento e mantello utilizzando` le metriche CloudWatch](monitoring-mantle-metrics.md)

## Metriche di runtime Amazon Bedrock
<a name="runtime-cloudwatch-metrics"></a>

La tabella seguente descrive le metriche di runtime fornite da Amazon Bedrock.


| Nome parametro | Unità | Description | 
| --- | --- | --- | 
| Invocazioni | SampleCount | Numero di richieste riuscite alle operazioni [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html), [ConverseStream[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html), e [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API. | 
| InvocationLatency | MilliSeconds | L'ora compresa tra l'invio di una richiesta e la ricezione dell'ultimo token.<br />Per distinguere gli aumenti di latenza causati dalle modifiche del throughput sul lato del servizio dagli aumenti causati da risposte più lunghe del modello, vedere. [Diagnostica gli `InvocationLatency`aumenti utilizzando token di output al secondo (OTPS)](monitoring-runtime-otps.md) | 
| InvocationClientErrors | SampleCount | Numero di invocazioni che provocano errori sul lato client. | 
| InvocationServerErrors | SampleCount | Numero di chiamate che generano errori sul lato server. AWS  | 
| InvocationThrottles | SampleCount | Numero di invocazioni limitate dal sistema. Le richieste con limitazione e altri errori di invocazione non vengono contate come invocazioni o errori. Il numero di limitazioni visualizzato dipenderà dalle impostazioni dei nuovi tentativi nell’SDK. Per ulteriori informazioni, consulta [Retry behavior](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html) nella Guida di riferimento agli AWS SDK and Tools.  | 
| InputTokenCount | SampleCount | Numero di token nell’input. | 
| LegacyModelInvocations | SampleCount | Numero di invocazioni che utilizzano modelli [Legacy](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_FoundationModelLifecycle.html)  | 
| OutputTokenCount | SampleCount | Numero di token nell’output. | 
| OutputImageCount | SampleCount | Numero di immagini nell’output (applicabile solo per i modelli di generazione di immagini). | 
| TimeToFirstToken | MilliSeconds | Orario compreso tra l'invio di una richiesta e la ricezione del primo token, per le operazioni dell'API [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)e [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)dello streaming. | 
| EstimatedTPMQuotaUsage | SampleCount | Consumo stimato di quote di token al minuto (TPM) nelle [operazioni Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) e [InvokeModel[InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)API. [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) Questa metrica è un'approssimazione e non riflette il consumo di token basato sulle prenotazioni che determina le decisioni di limitazione. Il throttling si basa sulla prenotazione anticipata di input tokens plus `max_tokens` (vedi), che può differire da questa stima. [Come vengono conteggiati i token in Amazon Bedrock](quotas-token-burndown.md) Non utilizzate questa metrica come unico indicatore per l'utilizzo delle quote o la pianificazione della capacità. | 
| CacheReadInputTokens | SampleCount | Numero di token di input letti dalla cache dei [prompt](prompt-caching.md). Questi token vengono addebitati a una tariffa ridotta e non vengono conteggiati ai fini della quota TPM. | 
| CacheWriteInputTokens | SampleCount | [Numero di token di input scritti nella cache dei prompt.](prompt-caching.md) Questi token vengono conteggiati ai fini della quota TPM. | 

Esistono anche metriche per [Guardrail per Amazon Bedrock](monitoring-guardrails-cw-metrics.md) e [Agent per Amazon Bedrock](monitoring-agents-cw-metrics.md).

## Metriche di registrazione delle invocazioni del modello CloudWatch
<a name="br-cloudwatch-metrics"></a>

Per ogni tentativo di consegna riuscito o non riuscito, vengono emesse le seguenti CloudWatch metriche Amazon sotto il namespace `AWS/Bedrock` e la dimensione: `Across all model IDs`
+ `ModelInvocationLogsCloudWatchDeliverySuccess`
+ `ModelInvocationLogsCloudWatchDeliveryFailure`
+ `ModelInvocationLogsS3DeliverySuccess`
+ `ModelInvocationLogsS3DeliveryFailure`
+ `ModelInvocationLargeDataS3DeliverySuccess`
+ `ModelInvocationLargeDataS3DeliveryFailure`

Per recuperare le metriche per le operazioni di Amazon Bedrock, specifica le seguenti informazioni:
+ La dimensione della metrica. Una *dimensione* è un set di coppie nome-valore utilizzate per identificare una metrica. Amazon Bedrock supporta le seguenti dimensioni:
  + `ModelId`: tutte le metriche
  + `ModelId + ImageSize + BucketedStepSize` – OutputImageCount
+ Il nome del parametro, ad esempio `InvocationClientErrors`. 

Puoi ottenere metriche per Amazon Bedrock con l' Console di gestione AWS AWS CLI, l'o l' CloudWatch API. Puoi utilizzare l' CloudWatch API tramite uno dei AWS Software Development Kit (SDK) o gli strumenti API. CloudWatch 

Per visualizzare i parametri di Amazon Bedrock nella CloudWatch console, vai alla sezione metriche nel riquadro di navigazione e seleziona l'opzione tutte le metriche, quindi cerca l'ID del modello.

È necessario disporre delle CloudWatch autorizzazioni appropriate per monitorare Amazon Bedrock con. CloudWatch Per ulteriori informazioni, consulta [Authentication and Access Control for Amazon CloudWatch nella Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/auth-and-access-control-cw.html) *User Guide*.