Solución de problemas de estados en AWS Step Functions mediante Amazon Bedrock - Recomendaciones de AWS

Solución de problemas de estados en AWS Step Functions mediante Amazon Bedrock

Aniket Kurzadkar y Sangam Kushwaha, Amazon Web Services

Resumen

Las funcionalidades de gestión de errores de AWS Step Functions pueden serle útiles para detectar un error que se produce durante un estado de un flujo de trabajo, pero aun así puede resultar difícil encontrar la causa de origen de un error y depurarlo. Este patrón aborda ese desafío y muestra cómo Amazon Bedrock puede serle útil para resolver los errores que se producen durante los estados de Step Functions.

Step Functions orquesta el flujo de trabajo, lo que facilita a los desarrolladores la automatización de los procesos. Step Functions también proporciona una funcionalidad de gestión de errores que ofrece las ventajas siguientes:

  • Los desarrolladores pueden crear aplicaciones más resilientes que no fallen por completo cuando algo sale mal.

  • Los flujos de trabajo pueden incluir lógica condicional para gestionar los distintos tipos de errores de otra manera.

  • El sistema puede volver a intentar las operaciones erróneas de manera automática, tal vez con un retroceso exponencial.

  • Se pueden definir rutas de ejecución alternativas para los escenarios de error, lo que permite que el flujo de trabajo se adapte y continúe procesándose.

Cuando se produce un error en un flujo de trabajo de Step Functions, este patrón muestra cómo se pueden enviar el mensaje de error y el contexto a un modelo fundacional (FM) como Claude 3, compatible con Step Functions. El FM puede analizar el error, clasificarlo y sugerir posibles medidas de corrección.

Requisitos previos y limitaciones

Requisitos previos

Limitaciones

  • Puede utilizar el enfoque de este patrón para varios Servicios de AWS. Sin embargo, los resultados pueden variar según la petición que creó AWS Lambda, que evalúa Amazon Bedrock posteriormente.

  • Algunos Servicios de AWS no están disponibles en todas las Regiones de AWS. Para obtener información sobre la disponibilidad en regiones, consulte AWS services by Region. Para ver los puntos de conexión específicos, consulte Service endpoints and quotas y elija el enlace del servicio.

Arquitectura

En el siguiente diagrama se muestran los componentes de la arquitectura y el flujo de trabajo de esta aplicación.

Flujo de trabajo para la gestión y notificación de errores mediante Step Functions, Amazon Bedrock y Amazon SNS.

En el diagrama se muestra el flujo de trabajo automatizado para la gestión y notificación de errores en una máquina de estados de Step Functions:

  1. El desarrollador inicia la ejecución de una máquina de estados.

  2. La máquina de estados de Step Functions comienza a procesar sus estados. Hay dos resultados posibles:

    • (a) Si todos los estados se ejecutan correctamente, el flujo de trabajo pasa de manera directa a Amazon SNS para recibir una notificación de operación correcta por correo electrónico.

    • (b) Si se produce un error en algún estado, el flujo de trabajo pasa a la función de Lambda de gestión de errores.

  3. En caso de error, sucede lo siguiente:

    • (a) Se desencadena la función de Lambda (controlador de errores). La función de Lambda extrae el mensaje de error de los datos del evento que le pasó la máquina de estados de Step Functions. A continuación, la función de Lambda prepara una petición según este mensaje de error y la envía a Amazon Bedrock. La petición solicita soluciones y sugerencias relacionadas con el error específico encontrado.

    • (b) Amazon Bedrock, que aloja el modelo de IA generativa, procesa la petición de entrada. (Este patrón utiliza el modelo fundacional (FM) Anthropic Claude 3, que es uno de los numerosos FM compatibles con Amazon Bedrock). El modelo de IA analiza el contexto del error. A continuación, el modelo genera una respuesta que puede incluir explicaciones de por qué se produjo el error, soluciones posibles para resolverlo y sugerencias para evitar cometer los mismos errores en el futuro.

      Amazon Bedrock devuelve su respuesta generada por IA a la función de Lambda. La función de Lambda procesa la respuesta y, posiblemente, la formatea o extrae información clave. A continuación, la función de Lambda envía la respuesta a la salida de la máquina de estados.

  4. Tras la gestión del error o una ejecución correcta, el flujo de trabajo finaliza con la activación de Amazon SNS para que envíe una notificación por correo electrónico.

Herramientas

Servicios de AWS

  • Amazon Bedrock es un servicio totalmente administrado que pone a su disposición modelos fundacionales (FM) de alto rendimiento de las principales startups de IA y Amazon a través de una API unificada.

  • AWS Lambda es un servicio de computación que ayuda a ejecutar código sin necesidad de aprovisionar ni administrar servidores. Ejecuta el código solo cuando es necesario y amplía la capacidad de manera automática, por lo que solo pagará por el tiempo de procesamiento que utilice.

  • Amazon Simple Notification Service (Amazon SNS) le permite coordinar y administrar el intercambio de mensajes entre publicadores y clientes, incluidos los servidores web y las direcciones de correo electrónico.

  • AWS Step Functions es un servicio de orquestación sin servidor que le permite combinar funciones de AWS Lambda y otros Servicios de AWS para crear aplicaciones esenciales desde el punto de vista empresarial.

Prácticas recomendadas

  • Dado que Amazon Bedrock es un modelo de IA generativo que aprende de los datos entrenados, también utiliza esos datos para entrenar y generar contexto. Como práctica recomendada, oculte la información privada que pueda provocar problemas de filtración de datos.

  • Si bien la IA generativa puede proporcionar información valiosa, una persona debe supervisar las decisiones críticas relacionadas con la gestión de errores, sobre todo en los entornos de producción.

Epics

TareaDescripciónHabilidades requeridas

Crear una máquina de estado

Para crear una máquina de estados que sea adecuada para el flujo de trabajo, haga lo siguiente:

  1. Inicie sesión en la Consola de administración de AWS y abra la AWS Step Functionsconsola de https://console.aws.amazon.com/states/home.

  2. En el panel de navegación izquierdo, elija Máquinas de estado.

  3. Elija Crear máquina de estado.

  4. Elija una plantilla según su caso de uso o elija En blanco para crear una plantilla según sus necesidades.

DevOps de AWS
TareaDescripciónHabilidades requeridas

Creación de una función de Lambda.

Para crear una función de Lambda, haga lo siguiente:

  1. En la Consola de administración de AWS, vaya a la consola de AWS Lambda.

  2. En el panel de navegación de la izquierda, seleccione Funciones y Crear una función.

  3. En la página Crear función, elija entre las opciones para crear una función. A continuación, indique un nombre en Nombre de función y elija el idioma correspondiente en la lista desplegable de Tiempo de ejecución.

  4. Seleccione Creación de función.

DevOps de AWS

Configure la lógica requerida en el código de Lambda.

  • Para conectarse a la API de Amazon Bedrock mediante AWS SDK para Python (Boto3), utilice el código siguiente.

    Este código configura un cliente para Amazon Bedrock, prepara los parámetros necesarios y, a continuación, envía una solicitud al modelo Claude 3 con una petición específica.

    Este patrón invoca el modelo Claude 3. Para más información acerca de todos los modelos fundacionales compatibles, tales como los identificadores de modelos relacionados, consulte Supported foundation models in Amazon Bedrock en la documentación de Amazon Bedrock.

client = boto3.client( service_name="bedrock-runtime", region_name="selected-region" ) # Invoke Claude 3 with the text prompt model_id = "your-model-id" # Select your Model ID, Based on the Model Id, Change the body format try: response = client.invoke_model( modelId=model_id, body=json.dumps( { "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ { "role": "user", "content": [{"type": "text", "text": prompt}], } ], } ), )
  • (Opcional) Sustituya los identificadores de Cuenta de AWS por los identificadores de cuenta de marcadores de posición. Por motivos de seguridad, este enfoque puede resultar útil para depurar registros, mensajes de error u otros resultados que podrían contener información confidencial sobre las cuentas.

    El código siguiente detectará números de 12 dígitos entre dos puntos (que es el formato de los identificadores de Cuenta de AWS en los nombres de recursos de Amazon (ARN) y algunos otros identificadores de AWS) y lo sustituirá por el identificador ":123456789012:" de cuenta del marcador de posición.

    def replace_account_id(input_string): # Use a regular expression to find the AWS account ID pattern account_id_pattern = r'(:\d{12}:)' # Replace the matched pattern with ":123456789012:" modified_string = re.sub(account_id_pattern, ":123456789012:", input_string) return modified_string
DevOps de AWS
TareaDescripciónHabilidades requeridas

Configure Lambda para gestionar los errores en Step Functions.

Para configurar Step Functions a fin de gestionar los errores sin interrumpir el flujo de trabajo, haga lo siguiente:

  1. En la consola de Step Functions, vaya a la máquina de estados que creó anteriormente.

  2. Elija Editar y, a continuación, elija el servicio para configurar la gestión de errores y elija Gestión de errores.

  3. Elija Agregar nuevo detector y, en Estado de reserva, elija Lambda y, a continuación, elija la función de Lambda que creó anteriormente. Para más información, consulte la Detectar errores en la documentación de Step Functions.

DevOps de AWS

Solución de problemas

ProblemaSolución

Lambda no puede acceder a la API de Amazon Bedrock (no tiene autorización para realizar la operación)

Este error se produce cuando el rol de Lambda no tiene permiso para acceder a la API de Amazon Bedrock. Para resolver este problema, agregue la política AmazonBedrockFullAccess para el rol de Lambda. Para más información, consulte AmazonBedrockFullAccess en la AWS Managed Policy Reference Guide.

Error del tiempo de espera de Lambda

A veces, es posible que tarde más de 30 segundos en generar una respuesta y enviarla, según la petición. Para resolver este problema, aumente el tiempo de configuración. Para más información, consulte Configure Lambda function timeout en la AWS Lambda Developer Guide.

Recursos relacionados