Solución de problemas de estados en AWS Step Functions mediante Amazon Bedrock
Aniket Kurzadkar y Sangam Kushwaha, Amazon Web Services
Resumen
Las funcionalidades de gestión de errores de AWS Step Functions pueden serle útiles para detectar un error que se produce durante un estado de un flujo de trabajo, pero aun así puede resultar difícil encontrar la causa de origen de un error y depurarlo. Este patrón aborda ese desafío y muestra cómo Amazon Bedrock puede serle útil para resolver los errores que se producen durante los estados de Step Functions.
Step Functions orquesta el flujo de trabajo, lo que facilita a los desarrolladores la automatización de los procesos. Step Functions también proporciona una funcionalidad de gestión de errores que ofrece las ventajas siguientes:
Los desarrolladores pueden crear aplicaciones más resilientes que no fallen por completo cuando algo sale mal.
Los flujos de trabajo pueden incluir lógica condicional para gestionar los distintos tipos de errores de otra manera.
El sistema puede volver a intentar las operaciones erróneas de manera automática, tal vez con un retroceso exponencial.
Se pueden definir rutas de ejecución alternativas para los escenarios de error, lo que permite que el flujo de trabajo se adapte y continúe procesándose.
Cuando se produce un error en un flujo de trabajo de Step Functions, este patrón muestra cómo se pueden enviar el mensaje de error y el contexto a un modelo fundacional (FM) como Claude 3, compatible con Step Functions. El FM puede analizar el error, clasificarlo y sugerir posibles medidas de corrección.
Requisitos previos y limitaciones
Requisitos previos
Una Cuenta de AWS activa
Comprensión básica de los flujos de trabajo de AWS Step Functions
Conectividad con la API de Amazon Bedrock
Limitaciones
Puede utilizar el enfoque de este patrón para varios Servicios de AWS. Sin embargo, los resultados pueden variar según la petición que creó AWS Lambda, que evalúa Amazon Bedrock posteriormente.
Algunos Servicios de AWS no están disponibles en todas las Regiones de AWS. Para obtener información sobre la disponibilidad en regiones, consulte AWS services by Region
. Para ver los puntos de conexión específicos, consulte Service endpoints and quotas y elija el enlace del servicio.
Arquitectura
En el siguiente diagrama se muestran los componentes de la arquitectura y el flujo de trabajo de esta aplicación.

En el diagrama se muestra el flujo de trabajo automatizado para la gestión y notificación de errores en una máquina de estados de Step Functions:
El desarrollador inicia la ejecución de una máquina de estados.
La máquina de estados de Step Functions comienza a procesar sus estados. Hay dos resultados posibles:
(a) Si todos los estados se ejecutan correctamente, el flujo de trabajo pasa de manera directa a Amazon SNS para recibir una notificación de operación correcta por correo electrónico.
(b) Si se produce un error en algún estado, el flujo de trabajo pasa a la función de Lambda de gestión de errores.
En caso de error, sucede lo siguiente:
(a) Se desencadena la función de Lambda (controlador de errores). La función de Lambda extrae el mensaje de error de los datos del evento que le pasó la máquina de estados de Step Functions. A continuación, la función de Lambda prepara una petición según este mensaje de error y la envía a Amazon Bedrock. La petición solicita soluciones y sugerencias relacionadas con el error específico encontrado.
(b) Amazon Bedrock, que aloja el modelo de IA generativa, procesa la petición de entrada. (Este patrón utiliza el modelo fundacional (FM) Anthropic Claude 3, que es uno de los numerosos FM compatibles con Amazon Bedrock). El modelo de IA analiza el contexto del error. A continuación, el modelo genera una respuesta que puede incluir explicaciones de por qué se produjo el error, soluciones posibles para resolverlo y sugerencias para evitar cometer los mismos errores en el futuro.
Amazon Bedrock devuelve su respuesta generada por IA a la función de Lambda. La función de Lambda procesa la respuesta y, posiblemente, la formatea o extrae información clave. A continuación, la función de Lambda envía la respuesta a la salida de la máquina de estados.
Tras la gestión del error o una ejecución correcta, el flujo de trabajo finaliza con la activación de Amazon SNS para que envíe una notificación por correo electrónico.
Herramientas
Servicios de AWS
Amazon Bedrock es un servicio totalmente administrado que pone a su disposición modelos fundacionales (FM) de alto rendimiento de las principales startups de IA y Amazon a través de una API unificada.
AWS Lambda es un servicio de computación que ayuda a ejecutar código sin necesidad de aprovisionar ni administrar servidores. Ejecuta el código solo cuando es necesario y amplía la capacidad de manera automática, por lo que solo pagará por el tiempo de procesamiento que utilice.
Amazon Simple Notification Service (Amazon SNS) le permite coordinar y administrar el intercambio de mensajes entre publicadores y clientes, incluidos los servidores web y las direcciones de correo electrónico.
AWS Step Functions es un servicio de orquestación sin servidor que le permite combinar funciones de AWS Lambda y otros Servicios de AWS para crear aplicaciones esenciales desde el punto de vista empresarial.
Prácticas recomendadas
Dado que Amazon Bedrock es un modelo de IA generativo que aprende de los datos entrenados, también utiliza esos datos para entrenar y generar contexto. Como práctica recomendada, oculte la información privada que pueda provocar problemas de filtración de datos.
Si bien la IA generativa puede proporcionar información valiosa, una persona debe supervisar las decisiones críticas relacionadas con la gestión de errores, sobre todo en los entornos de producción.
Epics
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Crear una máquina de estado | Para crear una máquina de estados que sea adecuada para el flujo de trabajo, haga lo siguiente:
| DevOps de AWS |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Creación de una función de Lambda. | Para crear una función de Lambda, haga lo siguiente:
| DevOps de AWS |
Configure la lógica requerida en el código de Lambda. |
| DevOps de AWS |
| Tarea | Descripción | Habilidades requeridas |
|---|---|---|
Configure Lambda para gestionar los errores en Step Functions. | Para configurar Step Functions a fin de gestionar los errores sin interrumpir el flujo de trabajo, haga lo siguiente:
| DevOps de AWS |
Solución de problemas
| Problema | Solución |
|---|---|
Lambda no puede acceder a la API de Amazon Bedrock (no tiene autorización para realizar la operación) | Este error se produce cuando el rol de Lambda no tiene permiso para acceder a la API de Amazon Bedrock. Para resolver este problema, agregue la política |
Error del tiempo de espera de Lambda | A veces, es posible que tarde más de 30 segundos en generar una respuesta y enviarla, según la petición. Para resolver este problema, aumente el tiempo de configuración. Para más información, consulte Configure Lambda function timeout en la AWS Lambda Developer Guide. |