Vista de agentes
La vista de agentes proporciona un panel de control personalizado para los agentes de la cuenta. Puede ver los datos de los agentes alojados en servicios nativos de AWS como AgentCore Runtime, Lambda o Amazon EC2. La vista también muestra los agentes que emiten telemetría a CloudWatch.
Información general
Las métricas y los paneles muestran los datos de los intervalos de agentes muestreados. Para obtener información acerca de los intervalos de agentes, consulte Intervalos.
Las siguientes métricas de agentes son compatibles con:
-
Agentes y puntos de conexión: número de agentes y alias instrumentados y que emiten intervalos
-
Sesiones: número de sesiones creadas por agentes instrumentados que emiten intervalos. Una sesión es similar a una conversación y contiene un contexto amplio
-
Seguimientos: número de seguimientos creados por agentes instrumentados que emiten intervalos. Un rastro es un ciclo individual de solicitud y respuesta en una sesión
-
Tasa de errores: porcentaje de errores en las interacciones de los agentes
-
Tasa de limitación: porcentaje de interacciones de agentes limitadas
Elija Ver detalles para ver las métricas de los agentes en gráficos.
Métricas de tiempo de ejecución
Las métricas y los paneles del tiempo de ejecución muestran datos de la primitiva del tiempo de ejecución. Con esta primitiva, puede alojar los agentes en el tiempo de ejecución de Amazon Bedrock AgentCore. Para más información, consulte Creación de un tiempo de ejecución de AgentCore.
AgentCore Runtime admite estas métricas
-
Agentes y alias del tiempo de ejecución: hace un seguimiento del número de agentes y alias alojados en AgentCore Runtime
-
Sesiones del tiempo de ejecución: hace un seguimiento del número de sesiones creadas por los agentes que se ejecutan en AgentCore Runtime. Una sesión es similar a una conversación y contiene un contexto amplio de todo el flujo de interacciones. Útil para monitorear el uso general de la plataforma, planificar la capacidad y comprender los patrones de interacción de los usuarios
-
Invocaciones del tiempo de ejecución: número total de solicitudes hechas a la API del plano de datos. Cada llamada a la API cuenta como una invocación, independientemente del tamaño de la carga útil de la solicitud o del estado de la respuesta
-
Errores del tiempo de ejecución: número de errores del sistema y del usuario. Para ver las definiciones de errores del sistema y del usuario, consulte Métricas del tiempo de ejecución proporcionadas por AgentCore
-
Limitaciones del tiempo de ejecución: el número de solicitudes limitadas por el servicio debido a que se han superado las TPS (transacciones por segundo) permitidas. Estas solicitudes devuelven ThrottlingException con el código de estado HTTP 429. Monitoree esta métrica para determinar si debe revisar las cuotas de servicio u optimizar los patrones de las solicitudes
Consulte los cambios en las métricas a lo largo del tiempo en el panel predeterminado. Amplíe Ver detalles para mostrar los gráficos de las métricas.
Agentes
Los agentes son componentes que recopilan y envían datos de monitoreo desde las aplicaciones. La tabla de agentes muestra todos los agentes configurados en su cuenta. Estos agentes se pueden alojar en servicios nativos de AWS como AgentCore Runtime, Lambda o Amazon EC2. En la tabla también se muestran otros agentes instrumentados para emitir telemetría a CloudWatch.
Puede usar Filtrar agentes para encontrar un agente específico que quiera analizar a fondo o también puede utilizar los nombres de las columnas para ordenar los agentes y encontrar el agente necesario. Seleccione el icono de engranaje para mostrar u ocultar columnas adicionales.
Para ver los detalles del agente, amplíe el nombre del agente.
Detalles del agente: información general
La pestaña Información general muestra paneles automáticos de las métricas de los agentes. Estas métricas provienen de muestras de intervalos y métricas de tiempo de ejecución (cuando el agente utiliza AgentCore Runtime).
El panel Evaluadores incluye información derivada de los intervalos con las evaluaciones activadas.
-
Los mejores deltas en las puntuaciones de los evaluadores: muestra los agentes evaluadores que han experimentado más cambios desde el último periodo, en función del periodo de tiempo que haya seleccionado.
-
Métricas de configuración de evaluación: muestra las métricas del estado operativo de los agentes evaluadores, lo que incluye el número de veces que se ejecutaron las evaluaciones y el número de errores detectados.
Para editar una configuración de evaluación con la consola de Amazon Bedrock AgentCore, haga clic en el enlace de la columna Evaluador o Configuración de evaluación. Para revisar los resultados del evaluados, haga clic en una puntuación de la columna Puntuación media. Para ver todas las evaluaciones del agente, elija la pestaña Evaluaciones. Para obtener más información, consulte Detalles del agente: evaluaciones.
El panel Métricas de agentes incluye métricas derivadas de intervalos muestreados:
-
Sesiones y seguimientos: recuento de sesiones y seguimientos de este agente
-
Uso del token de MF: recuento total del consumo de tokens del modelo fundacional. Puede filtrar el gráfico según un modelo fundacional concreto
-
Errores del sistema y del cliente: recuento de los errores del sistema durante el procesamiento de las solicitudes. Los altos niveles de errores en el servidor pueden indicar posibles problemas de infraestructura o servicio que requieren una investigación. Los errores del cliente se derivan de las solicitudes no válidas. Los altos niveles de errores del lado del cliente pueden indicar problemas con el formato de las solicitudes o los permisos
-
Errores y latencia por intervalo: los índices de error y la latencia de un intervalo concreto. Tenga en cuenta que un intervalo puede aparecer en muchos agentes
-
Limitaciones: número de solicitudes limitadas por el servicio debido a que se superan las TPS (transacciones por segundo) permitidas
-
Llamadas de tokens de acceso y Auth:Authorization entrantes: número de solicitudes de autenticación entrantes procesadas por el agente, como las comprobaciones de autorización y las validaciones de tokens de acceso procedentes de clientes o servicios externos
-
Distribución de Auth:Usage salientes: patrón de distribución de los métodos de autenticación salientes utilizados por el agente, que muestra la frecuencia y los tipos de mecanismos de autenticación empleados al acceder a servicios externos
El panel Métricas de Runtime incluye las métricas que AgentCore Runtime genera automáticamente:
-
Sesiones e invocaciones de Runtime: recuento de sesiones e invocaciones que este agente concreto generó mientras estaba alojado en Runtime
-
Latencia de Runtime: latencia de las solicitudes de los agentes alojados en Runtime
-
Limitaciones de Runtime: número de solicitudes limitadas por el servicio debido a que se superan las TPS (transacciones por segundo) permitidas