Monitorar Agentes do Amazon Bedrock com o CloudWatch Metrics
A tabela a seguir descreve as métricas de runtime fornecidas por Agentes do Amazon Bedrock que você pode monitorar com o Amazon CloudWatch Metrics.
Métricas de runtime
| Nome da métrica | Unidade | Descrição |
|---|---|---|
| InvocationCount | SampleCount | Número de solicitações para a operação de API. |
| TotalTime | Milissegundos | O tempo necessário para o servidor processar a solicitação. |
| TTFT | Milissegundos | Tempo até o primeiro token. Emitida quando a configuração de streaming está habilitada para uma solicitação invokeAgent ou invokeInlineAgent. |
| InvocationThrottles | SampleCount | Número de invocações que o sistema limitou. As solicitações com controle de utilização e outros erros de invocação não são consideradas invocações nem erros. |
| InvocationServerErrors | SampleCount | Número de invocações que resultam em erros do lado do servidor da AWS. |
| InvocationClientErrors | SampleCount | Número de invocações que resultam em erros do lado do cliente. |
| ModelLatency | Milissegundos | A latência do modelo. |
| ModelInvocationCount | SampleCount | Número de solicitações que o agente fez ao modelo. |
| ModelInvocationThrottles | SampleCount | Número de invocações do modelo com controle de utilização do nó central do Amazon Bedrock. As solicitações com controle de utilização e outros erros de invocação não são consideradas invocações nem erros. |
| ModelInvocationClientErrors | SampleCount | Número de invocações do modelo que resultam em erros do lado do cliente. |
| ModelInvocationServerErrors | SampleCount | Número de invocações do modelo que resultam em erros do lado do servidor da AWS. |
| InputTokenCount | SampleCount | Número de entradas de token no modelo. |
| outputTokenCount | SampleCount | Número de saídas de token do modelo. |
É possível visualizar as dimensões de agentes no console do CloudWatch com base na tabela abaixo:
Dimensão
| Nome da dimensão | Valores de dimensão | Disponíveis para as métricas a seguir |
|---|---|---|
| Operation | InvokeAgent, InvokeInlineAgent |
|
| Operation, ModelId | Qualquer operação de agente do Amazon Bedrock listada na dimensão Operation e o modelId de qualquer modelo principal do nó central do Amazon Bedrock. |
|
| Operation, AgentAliasArn, ModelId | Qualquer operação de agente do Amazon Bedrock listada na dimensão Operation e qualquer modelId de um modelo do Amazon Bedrock, agrupados pelo agentAliasArn e um alias de agente. |
|
Usar métricas do CloudWatch para agentes
É possível obter métricas para agentes com o Console de Gerenciamento da AWS, a AWS CLI ou a API do CloudWatch. É possível usar a API do CloudWatch por meio de um dos kits de desenvolvimento de software (SDKs) da AWS ou das ferramentas de API do CloudWatch.
O namespace para métricas de agentes no CloudWatch é AWS/Bedrock/Agents.
Você deve ter as permissões do CloudWatch apropriadas para monitorar agentes com o CloudWatch. Para obter mais informações, consulte Authentication and Access Control for CloudWatch, no Guia do usuário do Amazon CloudWatch.
Importante
Se não quiser que o CloudWatch use os dados coletados para melhorar os serviços do CloudWatch, você pode criar uma política de exclusão. Para ter mais informações, consulte Políticas de cancelamento de serviços de IA.
Se você não estiver vendo métricas publicadas no painel do CloudWatch, verifique se o perfil de serviço do IAM que você usou para criar o agente tem a política a seguir.