Monitorar Agentes do Amazon Bedrock com o CloudWatch Metrics - Amazon Bedrock

Monitorar Agentes do Amazon Bedrock com o CloudWatch Metrics

A tabela a seguir descreve as métricas de runtime fornecidas por Agentes do Amazon Bedrock que você pode monitorar com o Amazon CloudWatch Metrics.

Métricas de runtime

Nome da métrica Unidade Descrição
InvocationCount SampleCount Número de solicitações para a operação de API.
TotalTime Milissegundos O tempo necessário para o servidor processar a solicitação.
TTFT Milissegundos Tempo até o primeiro token. Emitida quando a configuração de streaming está habilitada para uma solicitação invokeAgent ou invokeInlineAgent.
InvocationThrottles SampleCount Número de invocações que o sistema limitou. As solicitações com controle de utilização e outros erros de invocação não são consideradas invocações nem erros.
InvocationServerErrors SampleCount Número de invocações que resultam em erros do lado do servidor da AWS.
InvocationClientErrors SampleCount Número de invocações que resultam em erros do lado do cliente.
ModelLatency Milissegundos A latência do modelo.
ModelInvocationCount SampleCount Número de solicitações que o agente fez ao modelo.
ModelInvocationThrottles SampleCount Número de invocações do modelo com controle de utilização do nó central do Amazon Bedrock. As solicitações com controle de utilização e outros erros de invocação não são consideradas invocações nem erros.
ModelInvocationClientErrors SampleCount Número de invocações do modelo que resultam em erros do lado do cliente.
ModelInvocationServerErrors SampleCount Número de invocações do modelo que resultam em erros do lado do servidor da AWS.
InputTokenCount SampleCount Número de entradas de token no modelo.
outputTokenCount SampleCount Número de saídas de token do modelo.

É possível visualizar as dimensões de agentes no console do CloudWatch com base na tabela abaixo:

Dimensão

Nome da dimensão Valores de dimensão Disponíveis para as métricas a seguir
Operation InvokeAgent, InvokeInlineAgent
  • InvocationCount

  • TotalTime

  • TTFT

  • InvocationThrottles

  • InvocationServerErrors

  • InvocationClientErrors

  • ModelLatency

  • ModelInvocationCount

  • ModelInvocationThrottles

  • ModelInvocationClientErrors

  • ModelInvocationServerErrors

  • InputTokenCount

  • OutputTokenCount

Operation, ModelId Qualquer operação de agente do Amazon Bedrock listada na dimensão Operation e o modelId de qualquer modelo principal do nó central do Amazon Bedrock.
  • TotalTime

  • ModelLatency

  • ModelInvocationCount

  • ModelInvocationThrottles

  • ModelInvocationClientErrors

  • ModelInvocationServerErrors

  • InputTokenCount

  • OutputTokenCount

Operation, AgentAliasArn, ModelId Qualquer operação de agente do Amazon Bedrock listada na dimensão Operation e qualquer modelId de um modelo do Amazon Bedrock, agrupados pelo agentAliasArn e um alias de agente.
  • InvocationCount

  • TotalTime

  • TTFT

  • InvocationThrottles

  • InvocationServerErrors

  • InvocationClientErrors

  • ModelLatency

  • ModelInvocationCount

  • ModelInvocationThrottles

  • ModelInvocationClientErrors

  • ModelInvocationServerErrors

  • InputTokenCount

  • OutputTokenCount

Usar métricas do CloudWatch para agentes

É possível obter métricas para agentes com o Console de Gerenciamento da AWS, a AWS CLI ou a API do CloudWatch. É possível usar a API do CloudWatch por meio de um dos kits de desenvolvimento de software (SDKs) da AWS ou das ferramentas de API do CloudWatch.

O namespace para métricas de agentes no CloudWatch é AWS/Bedrock/Agents.

Você deve ter as permissões do CloudWatch apropriadas para monitorar agentes com o CloudWatch. Para obter mais informações, consulte Authentication and Access Control for CloudWatch, no Guia do usuário do Amazon CloudWatch.

Importante

Se não quiser que o CloudWatch use os dados coletados para melhorar os serviços do CloudWatch, você pode criar uma política de exclusão. Para ter mais informações, consulte Políticas de cancelamento de serviços de IA.

Se você não estiver vendo métricas publicadas no painel do CloudWatch, verifique se o perfil de serviço do IAM que você usou para criar o agente tem a política a seguir.

JSON
{ "Version":"2012-10-17", "Statement": { "Effect": "Allow", "Resource": "*", "Action": "cloudwatch:PutMetricData", "Condition": { "StringEquals": { "cloudwatch:namespace": "AWS/Bedrock/Agents" } } } }