Memória - Amazon CloudWatch

Memória

Entenda como os agentes armazenam, recuperam e usam informações contextuais para proporcionar experiências personalizadas. Para saber mais sobre a memória do Amazon Bedrock AgentCore, consulte Adicionar memória ao agente de IA. A observabilidade da memória inclui três áreas principais de monitoramento:

  • Memórias: monitorar padrões de armazenamento e recuperação de memória

  • Sessões de memória: monitorar o uso de memória em sessões individuais

  • Visão Rastros: acessar informações detalhadas de rastros de operações de memória

Visão de memória

Para entender a memória de curto ou longo prazo, consulte Adicionar memória ao agente de IA.

Escolha Visualizar detalhes para visualizar as métricas de memória em gráficos.

Visão de métricas de memória

Em Memórias, você pode visualizar todas as memórias associadas à sua conta. Escolha um nome de memória para ver os detalhes da memória.

Visão de métricas de memória

Na página Detalhes da memória, você verá as seguintes guias:

  • Visão geral: exibe métricas abrangentes de performance e padrões de uso da memória do recurso de memória selecionado

    • Agentes associados: você pode visualizar os agentes usando a memória. Escolha um agente/endpoint para visualizar a página de visão geral do agente.

    • Invocações de API de memória: número total de chamadas de API feitas para operações de memória, incluindo solicitações de armazenamento, recuperação e atualização. Essa métrica ajuda a acompanhar o uso do sistema de memória e o planejamento de capacidade

    • Registros da memória extraídos: contagem dos registros de memória extraídos e processados com sucesso das interações do agente. Isso inclui informações contextuais, preferências do usuário e histórico de conversas que os agentes armazenam para personalização

    • Erros de servidor: contagem de erros do sistema durante operações de memória. Níveis altos indicam possíveis problemas de infraestrutura com os sistemas de recuperação ou armazenamento de memória que requerem investigação

    • Erros do cliente: erros resultantes de solicitações de memória inválidas, dados malformados ou problemas de permissão. Altas taxas de erros de clientes podem indicar problemas de integração de memória do agente ou formatação de dados

    • Controle de utilização: número de solicitações de memória que sofreram controle de utilização porque limites de transações permitidos foram excedidos. Monitore esta métrica para determinar se os padrões de acesso à memória precisam ser otimizados ou se as cotas de serviço exigem ajustes

    • Latência: tempo de resposta em operações de memória, incluindo solicitações de armazenamento e recuperação. Acompanhar as latências P50, P90 e P99 para identificar gargalos de performance e otimizar os padrões de acesso à memória

  • Sessões de memória: você pode visualizar a sessão que contém a memória de curto prazo das interações do agente. Em Sessões de memória, escolha ID da sessão para visualizar o painel da sessão.

  • Rastros: exibe os rastros dos agentes. Em Rastros, escolha ID do rastro para visualizar os rastros que invocam uma memória específica. Use o painel de rastros para se aprofundar no uso de memória do agente e nas respostas finais.

nota

A experiência e os campos das guias Sessões de memória e Rastros são semelhantes em observabilidade de ferramentas incorporadas, gateways, memória e identidade. Para saber mais sobre os campos, consulte Ferramenta de interpretação de código.