Visualização por agente
A Visualização por agente fornece um painel selecionado para os agentes da sua conta. É possível visualizar dados de agentes hospedados em serviços nativos da AWS, como o AgentCore Runtime, o Lambda ou o Amazon EC2. Essa visualização também exibe agentes que enviam telemetria para o CloudWatch.
Visão geral
As métricas e os painéis apresentam dados provenientes de amostras de extensões dos agentes. Para obter informações sobre as extensões dos agentes, consulte Spans.
As seguintes métricas são compatíveis para os agentes:
-
Agentes/Alias: número de agentes e aliases instrumentados e que emitem extensões.
-
Sessões: número de sessões criadas por agentes instrumentados que emitem extensões. Uma sessão é semelhante a uma conversa e contém o contexto amplo.
-
Rastreamentos: número de rastreamentos criados por agentes instrumentados que emitem extensões. Um rastreamento corresponde a um ciclo individual de solicitação e de resposta dentro de uma sessão.
-
Taxa de erros: porcentagem de erros nas interações dos agentes.
-
Taxa de controle de utilização: porcentagem de interações do agente com controle de utilização.
Escolha Visualizar detalhes para visualizar as métricas para os agentes em gráficos.

Métricas de runtime
As métricas e os painéis de runtime exibem dados provenientes da primitiva runtime. Usando essa primitiva, você pode hospedar seus agentes no runtime do Amazon Bedrock AgentCore. Para obter mais informações, consulte Creating an AgentCore Runtime.
O AgentCore Runtime é compatível com as seguintes métricas:
Agentes/Aliases do runtime: acompanha o número de agentes e aliases hospedados no AgentCore Runtime.
Sessões do runtime: acompanha o número de sessões criadas por agentes em execução no AgentCore Runtime. Uma sessão é semelhante a uma conversa e contém o contexto amplo de todo o fluxo de interação. Essa métrica é útil para monitorar o uso geral da plataforma, realizar o planejamento de capacidade e ter uma compreensão dos padrões de engajamento dos usuários.
Invocações do runtime: número total de solicitações realizadas à API do plano de dados. Cada chamada de API é contabilizada como uma invocação, independentemente do tamanho da carga útil da solicitação ou do status da resposta.
Erros do runtime: número de erros relacionados ao sistema e ao usuário. Para obter definições de erros relacionados ao sistema e ao usuário, consulte AgentCore provided runtime metrics.
Controles de utilização do runtime: número de solicitações com controle de utilização pelo serviço devido ao excedente do limite permitido de TPS (transações por segundo). Essas solicitações retornam “ThrottlingException” com o código de status HTTP 429. Monitore essa métrica para determinar se é necessário analisar suas cotas de serviço ou otimizar os padrões de solicitação.
Visualize as alterações das métricas ao longo do tempo no painel padrão. Expanda Visualizar detalhes para exibir gráficos de métricas.

Atendentes
Os agentes são os componentes responsáveis por coletar e transmitir dados de monitoramento das suas aplicações. A tabela Agentes apresenta todos os agentes configurados na sua conta. Esses agentes podem ser hospedados em serviços nativos da AWS, como o AgentCore Runtime, o Lambda ou o Amazon EC2. Além disso, a tabela apresenta outros agentes que são instrumentados para emitir telemetria ao CloudWatch.
Você pode usar o filtro de agentes para localizar um agente específico que deseja analisar detalhadamente, ou também pode utilizar os nomes das colunas para classificar os agentes e localizar o agente desejado. Selecione o ícone de engrenagem para apresentar ou ocultar colunas adicionais.

Os detalhes do agente podem ser visualizados ao expandir o nome do agente.

Detalhes do agente: visão geral
A guia Visão geral apresenta painéis automáticos para as métricas dos seus agentes. Essas métricas são provenientes de extensões incluídas na amostra e métricas de runtime (quando o agente faz uso do AgentCore Runtime).
O painel Métricas do agente inclui métricas que são derivadas de extensões incluídas na amostra:
Sessões e rastreamentos: contagem de sessões e de rastreamentos para este agente.
Uso de tokens de FM: contagem total do consumo de tokens de modelos de base. É possível filtrar o gráfico para um modelo de base específico.
Erros relacionados ao sistema e ao cliente: contagem de erros do sistema ocorridos durante o processamento de solicitações. Altos níveis de erros no lado do servidor podem indicar possíveis problemas relacionados à infraestrutura ou ao serviço que requerem investigação. Os erros do cliente, por sua vez, são erros resultantes de solicitações inválidas. Altos níveis de erros do lado do cliente podem indicar problemas relacionados à formatação das solicitações ou às permissões.
Erros e latência por extensão: as taxas de erro e a latência em uma extensão específica. Atente-se ao fato de que uma extensão pode estar presente em vários agentes.
Controles de utilização: número de solicitações com controle de utilização pelo serviço devido ao excedente do limite permitido de TPS (transações por segundo).
O painel Métricas do runtime inclui métricas geradas automaticamente pelo AgentCore Runtime:
Sessões e invocações do runtime: contagem de sessões e invocações que este agente em específico gerou enquanto estava hospedado no runtime.
Latência do runtime: tempo de latência das solicitações realizadas por agentes hospedados no runtime.
Controles de utilização do runtime: número de solicitações com controle de utilização pelo serviço devido ao excedente do limite permitido de TPS (transações por segundo).
Detalhes do agente: sessões
Um agente pode ter várias sessões. Visualize a sessão na guia Sessões. Use o filtro de sessões ou classifique as colunas para localizar a sessão desejada.
Escolha o ID da sessão para visualizar as métricas da sessão resumidas e a lista de rastreamentos pertencentes a essa sessão. As métricas da sessão incluem:
Rastreamentos: número de rastreamentos pertencentes às sessões.
Erros relacionados ao sistema: contagem de erros do sistema ocorridos durante o processamento de solicitações. Altos níveis de erros no lado do servidor podem indicar possíveis problemas relacionados à infraestrutura ou ao serviço que requerem investigação.
Erros relacionados ao cliente: erros relacionados ao cliente são erros resultantes de solicitações inválidas. Altos níveis de erros do lado do cliente podem indicar problemas relacionados à formatação das solicitações ou às permissões.
Controles de utilização: número de solicitações com controle de utilização relevante para esta sessão devido ao excedente do limite permitido de TPS (transações por segundo).
Detalhes das sessões: metadados relacionados à sessão, como o horário de início, o horário de término e ID da sessão.
Para analisar uma lista de rastreamentos em uma sessão, escolha o filtro de rastreamentos para reduzir os resultados ou classifique as colunas da tabela para evidenciar o rastreamento específico que deseja investigar.
Depois de você selecionar um rastreamento, o painel direito exibirá os detalhes do rastreamento. Para cada rastreamento, você poderá visualizar o resumo de rastreamento, as extensões e os detalhes do conteúdo do rastreamento.
Em Resumo de rastreamento, você poderá visualizar as seguintes métricas:
nota
Os campos da página de resumo são consistentes entre a Visualização por agente, a Visualização por sessões e a Visualização por rastreamentos.
Extensões: número de extensões dentro de um rastreamento.
Erros relacionados ao sistema: contagem de erros do sistema ocorridos durante o processamento de solicitações. Altos níveis de erros no lado do servidor podem indicar possíveis problemas relacionados à infraestrutura ou ao serviço que requerem investigação.
Erros relacionados ao cliente: erros relacionados ao cliente são erros resultantes de solicitações inválidas. Altos níveis de erros do lado do cliente podem indicar problemas relacionados à formatação das solicitações ou às permissões.
Controles de utilização: número de solicitações com controle de utilização relevante para esta sessão devido ao excedente do limite permitido de TPS (transações por segundo).
Latência P95 da extensão: a latência no percentil 95 considerando todas as invocações desta extensão específica. Atente-se ao fato de que uma extensão pode ser usada em vários agentes.
Detalhes do rastreamento: metadados relacionados ao rastreamento, como o horário de início, o horário de término e ID do rastreamento.

Selecione Linha do tempo para visualizar a duração de cada extensão e compreender qual delas demorou mais tempo, contribuindo para uma resposta lenta.

Para analisar as relações entre as extensões e as chamadas subsequentes, escolha Trajetória a fim de compreender a relação interconectada entre as extensões e as chamadas subsequentes que se originam dessas extensões.
Em Extensões, selecione um evento de extensão individual para analisar os dados da extensão em seu formato original. Analise os dados da extensão no seu formato original. Para realizar uma solução de problemas detalhada, selecione a guia Eventos para examinar as entradas e saídas do modelo.
Detalhes do agente: rastreamentos
Cada agente pode ter vários rastreamentos. Visualize os detalhes do rastreamento na guia Rastreamentos. Escolha o filtro de rastreamentos ou classifique as colunas para localizar o rastreamento desejado.