Vista de agentes - Amazon CloudWatch

Vista de agentes

La vista de agentes proporciona un panel de control personalizado para los agentes de la cuenta. Puede ver los datos de los agentes alojados en servicios nativos de AWS como AgentCore Runtime, Lambda o Amazon EC2. La vista también muestra los agentes que emiten telemetría a CloudWatch.

Información general

Las métricas y los paneles muestran los datos de los intervalos de agentes muestreados. Para obtener información acerca de los intervalos de agentes, consulte Intervalos.

Las siguientes métricas de agentes son compatibles con:

  • Agentes y alias: número de agentes y alias instrumentados y que emiten intervalos

  • Sesiones: número de sesiones creadas por agentes instrumentados que emiten intervalos. Una sesión es similar a una conversación y contiene un contexto amplio

  • Rastros: número de rastros creados por agentes instrumentados que emiten intervalos. Un rastro es un ciclo individual de solicitud y respuesta en una sesión

  • Tasa de errores: porcentaje de errores en las interacciones de los agentes

  • Tasa de limitación: porcentaje de interacciones de agentes limitadas

Elija Ver detalles para ver las métricas de los agentes en gráficos.

Vista de agentes

Métricas de tiempo de ejecución

Las métricas y los paneles del tiempo de ejecución muestran datos de la primitiva del tiempo de ejecución. Con esta primitiva, puede alojar los agentes en el tiempo de ejecución de Amazon Bedrock AgentCore. Para más información, consulte Creación de un tiempo de ejecución de AgentCore.

AgentCore Runtime admite estas métricas

  • Agentes y alias del tiempo de ejecución: hace un seguimiento del número de agentes y alias alojados en AgentCore Runtime

  • Sesiones del tiempo de ejecución: hace un seguimiento del número de sesiones creadas por los agentes que se ejecutan en AgentCore Runtime. Una sesión es similar a una conversación y contiene un contexto amplio de todo el flujo de interacciones. Útil para monitorear el uso general de la plataforma, planificar la capacidad y comprender los patrones de interacción de los usuarios

  • Invocaciones del tiempo de ejecución: número total de solicitudes hechas a la API del plano de datos. Cada llamada a la API cuenta como una invocación, independientemente del tamaño de la carga útil de la solicitud o del estado de la respuesta

  • Errores del tiempo de ejecución: número de errores del sistema y del usuario. Para ver las definiciones de errores del sistema y del usuario, consulte Métricas del tiempo de ejecución proporcionadas por AgentCore

  • Limitaciones del tiempo de ejecución: el número de solicitudes limitadas por el servicio debido a que se han superado las TPS (transacciones por segundo) permitidas. Estas solicitudes devuelven ThrottlingException con el código de estado HTTP 429. Monitoree esta métrica para determinar si debe revisar las cuotas de servicio u optimizar los patrones de las solicitudes

Consulte los cambios en las métricas a lo largo del tiempo en el panel predeterminado. Amplíe Ver detalles para mostrar los gráficos de las métricas.

Vista del tiempo de ejecución

Agentes

Los agentes son componentes que recopilan y envían datos de monitoreo desde las aplicaciones. La tabla de agentes muestra todos los agentes configurados en su cuenta. Estos agentes se pueden alojar en servicios nativos de AWS como AgentCore Runtime, Lambda o Amazon EC2. En la tabla también se muestran otros agentes instrumentados para emitir telemetría a CloudWatch.

Puede usar Filtrar agentes para encontrar un agente específico que quiera analizar a fondo o también puede utilizar los nombres de las columnas para ordenar los agentes y encontrar el agente necesario. Seleccione el icono de engranaje para mostrar u ocultar columnas adicionales.

Vista de agentes del tiempo de ejecución

Para ver los detalles del agente, amplíe el nombre del agente.

Información general de los agentes del tiempo de ejecución

Detalles del agente: información general

La pestaña Información general muestra paneles automáticos de las métricas de los agentes. Estas métricas provienen de muestras de intervalos y métricas de tiempo de ejecución (cuando el agente utiliza AgentCore Runtime).

El panel Métricas de agentes incluye métricas derivadas de intervalos muestreados:

  • Sesiones y rastros: recuento de sesiones y rastros de este agente

  • Uso del token de MF: recuento total del consumo de tokens del modelo fundacional. Puede filtrar el gráfico según un modelo fundacional concreto

  • Errores del sistema y del cliente: recuento de los errores del sistema durante el procesamiento de las solicitudes. Los altos niveles de errores en el servidor pueden indicar posibles problemas de infraestructura o servicio que requieren una investigación. Los errores del cliente se derivan de las solicitudes no válidas. Los altos niveles de errores del lado del cliente pueden indicar problemas con el formato de las solicitudes o los permisos

  • Errores y latencia por intervalo: los índices de error y la latencia de un intervalo concreto. Tenga en cuenta que un intervalo puede aparecer en muchos agentes

  • Limitaciones: número de solicitudes limitadas por el servicio debido a que se superan las TPS (transacciones por segundo) permitidas

El panel Métricas de Runtime incluye las métricas que AgentCore Runtime genera automáticamente:

  • Sesiones e invocaciones de Runtime: recuento de sesiones e invocaciones que este agente concreto generó mientras estaba alojado en Runtime

  • Latencia de Runtime: latencia de las solicitudes de los agentes alojados en Runtime

  • Limitaciones de Runtime: número de solicitudes limitadas por el servicio debido a que se superan las TPS (transacciones por segundo) permitidas

Detalles de agentes: sesiones

Un agente puede tener varias sesiones. Vea la sesión en la pestaña Sesiones. Utilice Filtrar sesiones u ordene las columnas para encontrar la sesión necesaria.

Elija el ID de sesión para ver las métricas del resumen de la sesión y la lista de seguimientos que pertenecen a esa sesión. Las métricas de sesión incluyen:

  • Rastros: número de rastros que pertenecen a las sesiones

  • Errores del servidor: recuento de los errores del sistema durante el procesamiento de las solicitudes. Los altos niveles de errores en el servidor pueden indicar posibles problemas de infraestructura o servicio que requieren una investigación

  • Errores del cliente: los errores del cliente se derivan de las solicitudes no válidas. Los altos niveles de errores del lado del cliente pueden indicar problemas con el formato de las solicitudes o los permisos

  • Limitaciones: número de solicitudes limitadas correspondientes a esta sesión debido a que se superaron las TPS (transacciones por segundo) permitidas

  • Detalles de la sesión: metadatos sobre la sesión, como la hora de inicio, la hora de finalización y el ID de la sesión

Para analizar una lista de rastros en una sesión, seleccione Filtrar rastros para reducirlos u ordene las columnas de la tabla para que aparezca el rastro concreto que quiere investigar.

Tras seleccionar un rastro, en el panel derecho se muestran los detalles del rastro. Para cada rastro, puede ver el resumen de este, los intervalos y los detalles del contenido del rastro.

En Resumen del rastro, puede ver las siguientes métricas:

nota

Los campos de la página de resumen son coherentes en Vista de agentes, Vista de sesiones y Vista de rastros.

  • Intervalos: número de intervalos en un rastro

  • Errores del servidor: recuento de los errores del sistema durante el procesamiento de las solicitudes. Los altos niveles de errores en el servidor pueden indicar posibles problemas de infraestructura o servicio que requieren una investigación

  • Errores del cliente: los errores del cliente se derivan de las solicitudes no válidas. Los altos niveles de errores del lado del cliente pueden indicar problemas con el formato de las solicitudes o los permisos

  • Limitaciones: el número de solicitudes limitadas correspondientes a esta sesión se debe a que se superan las TPS (transacciones por segundo) permitidas

  • Latencia de intervalo de P95: latencia del percentil 95 de todas las invocaciones de este intervalo en particular. Tenga en cuenta que un intervalo se puede utilizar en muchos agentes

  • Detalles del rastro: metadatos sobre el rastro, como la hora de inicio, la hora de finalización y el ID del rastro

Vista de intervalo

Elija Cronología para ver la duración de cada intervalo y comprender el intervalo que tardó más y contribuyó a una respuesta lenta.

Vista de trayectoria

Para analizar las relaciones de los intervalos y las llamadas posteriores, elija Trayectoria para comprender la relación interconectada de los intervalos y las llamadas posteriores de estos intervalos.

En Intervalos, seleccione un evento de intervalo individual para revisar los datos del intervalo en su formato original. Revise los datos del intervalo en su forma original. Para una solución de problemas detallada, seleccione la pestaña Eventos para examinar las entradas y salidas del modelo.

Detalles del agente: rastros

Cada agente puede tener varios rastros. Vea los detalles de los rastros en la pestaña Rastros. Elija Filtrar rastros u ordene las columnas para encontrar el rastro necesario.