

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Monitore a `inferência fundamental do tempo de execução usando métricas` CloudWatch
<a name="monitoring-runtime-metrics"></a>

O `bedrock-runtime.{{region}}.amazonaws.com` endpoint Amazon Bedrock publica métricas para a Amazon CloudWatch sob o namespace. `AWS/Bedrock` Use essas métricas para monitorar o volume de invocação, a latência, o consumo de tokens, as taxas de erro e a entrega do registro de invocações do modelo.

Se seu aplicativo chama a inferência`bedrock-mantle.{{region}}.api.aws`, consulte [Monitore a `inferência fundamental usando métricas` CloudWatch](monitoring-mantle-metrics.md) em vez disso.

## Métricas de runtime do Amazon Bedrock
<a name="runtime-cloudwatch-metrics"></a>

A tabela a seguir descreve as métricas de tempo de execução fornecidas pelo Amazon Bedrock.


| Nome da métrica | Unidade | Description | 
| --- | --- | --- | 
| Invocations | SampleCount | Número de solicitações bem-sucedidas para as operações da [Converse [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html), [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html), e [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)da API. | 
| InvocationLatency | MilliSeconds | O horário desde o envio de uma solicitação até o recebimento do último token.<br />Para distinguir os aumentos de latência causados por alterações na taxa de transferência do lado do serviço dos aumentos causados por respostas mais longas do modelo, consulte. [Diagnostique `InvocationLatency`aumentos usando tokens de saída por segundo (OTPS)](monitoring-runtime-otps.md) | 
| InvocationClientErrors | SampleCount | Número de invocações que resultam em erros do lado do cliente. | 
| InvocationServerErrors | SampleCount | Número de invocações que resultam em erros do lado do AWS servidor. | 
| InvocationThrottles | SampleCount | Número de invocações que o sistema limitou. As solicitações com controle de utilização e outros erros de invocação não são consideradas invocações nem erros. O número de controles de utilização observado dependerá das configurações de nova tentativa estabelecidas no SDK. Para obter mais informações, consulte o [comportamento de novas tentativas](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html) no Guia de referência de AWS SDKs e ferramentas.  | 
| InputTokenCount | SampleCount | Número de tokens na entrada. | 
| LegacyModelInvocations | SampleCount | Número de invocações usando modelos [herdados](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_FoundationModelLifecycle.html)  | 
| OutputTokenCount | SampleCount | Número de tokens na saída. | 
| OutputImageCount | SampleCount | Número de imagens na saída (aplicável somente a modelos de geração de imagens). | 
| TimeToFirstToken | MilliSeconds | Tempo desde o envio da solicitação até o recebimento do primeiro token, para as [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)operações da API [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)de streaming. | 
| EstimatedTPMQuotaUsage | SampleCount | Consumo estimado da cota de tokens por minuto (TPM) nas operações da [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html), [ConverseStream[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html), e [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)da API. Essa métrica é uma aproximação e não reflete o consumo de tokens baseado em reservas que impulsiona as decisões de limitação. A limitação é baseada na reserva inicial de tokens de entrada plus `max_tokens` (consulte[Como os tokens são contados no Amazon Bedrock](quotas-token-burndown.md)), que pode ser diferente dessa estimativa. Não use essa métrica como o único indicador de uso de cotas ou planejamento de capacidade. | 
| CacheReadInputTokens | SampleCount | Número de tokens de entrada lidos do [cache de prompts](prompt-caching.md). Esses tokens são cobrados a uma taxa reduzida e não contam para sua cota de TPM. | 
| CacheWriteInputTokens | SampleCount | Número de tokens de entrada gravados no [cache do prompt](prompt-caching.md). Esses tokens contam para sua cota de TPM. | 

Também há métricas para as [Barreiras de Proteção do Amazon Bedrock](monitoring-guardrails-cw-metrics.md) e os [Agentes do Amazon Bedrock](monitoring-agents-cw-metrics.md).

## Métricas de registro de invocação de modelos CloudWatch
<a name="br-cloudwatch-metrics"></a>

Para cada tentativa de entrega bem-sucedida ou falha, as seguintes CloudWatch métricas da Amazon são emitidas sob o namespace `AWS/Bedrock` e a dimensão: `Across all model IDs`
+ `ModelInvocationLogsCloudWatchDeliverySuccess`
+ `ModelInvocationLogsCloudWatchDeliveryFailure`
+ `ModelInvocationLogsS3DeliverySuccess`
+ `ModelInvocationLogsS3DeliveryFailure`
+ `ModelInvocationLargeDataS3DeliverySuccess`
+ `ModelInvocationLargeDataS3DeliveryFailure`

Para recuperar métricas para as operações do Amazon Bedrock, especifique as seguintes informações:
+ A dimensão da métrica. Uma *dimensão* é um conjunto de pares de nome-valor que você usa para identificar uma métrica. O Amazon Bedrock é compatível com as seguintes dimensões:
  + `ModelId`: todas as métricas
  + `ModelId + ImageSize + BucketedStepSize` – OutputImageCount
+ O nome da métrica, como `InvocationClientErrors`. 

Você pode obter métricas para o Amazon Bedrock com a Console de gerenciamento da AWS AWS CLI, a ou a CloudWatch API. Você pode usar a CloudWatch API por meio de um dos kits de desenvolvimento de AWS software (SDKs) ou das ferramentas da CloudWatch API.

Para visualizar as métricas do Amazon Bedrock no CloudWatch console, acesse a seção de métricas no painel de navegação, selecione a opção Todas as métricas e, em seguida, pesquise o ID do modelo.

Você deve ter as CloudWatch permissões apropriadas para monitorar o Amazon Bedrock com. CloudWatch Para obter mais informações, consulte [Autenticação e controle de acesso para a Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/auth-and-access-control-cw.html) no *Guia CloudWatch do usuário da Amazon*.