Observabilidad de IA generativa
Con Amazon CloudWatch, puede observar las cargas de trabajo de IA generativa, tales como agentes de Amazon Bedrock AgentCore
La observabilidad de IA generativa de CloudWatch le permite:
-
Evalúe la calidad y precisión de las aplicaciones de IA a escala mediante la supervisión automatizada, lo que reduce los requisitos de revisión manual al capturar los resultados del modelo, las métricas de calidad de respuesta y las interacciones de los usuarios finales.
-
Supervisar las invocaciones de los modelos, los agentes (administrados, autoalojados y de terceros), las bases de conocimiento, las barreras de protección y las herramientas
-
Avanzar a partir de la experimentación con agentes hasta la producción de aplicaciones innovadoras de IAGen, lo que garantiza también una calidad, un rendimiento y una fiabilidad superiores. Para más información, consulte ¿Qué es Amazon Bedrock AgentCore?
-
Identificar rápidamente el origen de los errores mediante el rastreo de peticiones de principio a fin, las métricas seleccionadas y los registros
-
Solucionar problemas en toda la aplicación de IAGen y la infraestructura subyacente mediante el uso de las herramientas de observabilidad de CloudWatch existentes, como Application Signals, Alarms, Dashboards, Sensitive data protection y Logs Insights
-
Acceder a los seguimientos de peticiones mientras utiliza Amazon Bedrock y envíe seguimientos estructurados de modelos de terceros a CloudWatch mediante el SDK de ADOT. Para obtener información sobre cómo agregar observabilidad a su agente o herramienta de Amazon Bedrock AgentCore, consulte Amazon Bedrock AgentCore
La observabilidad de la IA generativa de CloudWatch ofrece dos capacidades prediseñadas:
nota
Puede utilizar el panel Invocación de modelos mediante cualquier modelo de inferencia en Amazon Bedrock.
-
Invocaciones de modelos: panel de métricas detallado sobre el uso de modelos, el consumo de tokens y una tabla de registros de invocaciones seleccionada para ver el contenido detallado de entrada y salida de las inferencias del modelo
-
Agentes de Amazon Bedrock AgentCore: métricas de rendimiento y decisión para primitivas de Amazon Bedrock AgentCore, como agentes, memoria, herramientas integradas, puertas de enlace e identidad
Las métricas clave disponibles en estos paneles incluyen:
-
Invocaciones totales y promedio
-
Uso de tokens (total, promedio por consulta, entrada, salida)
-
Latencia (promedio, P90, P99)
-
Tasas de error y eventos de limitación
-
Atribución de costos por aplicación, rol de usuario o usuario específico