El patrón de flujo de trabajo de la IA en varias etapas: canalizaciones de IA modulares, observables y sin servidor Caso de uso: ingesta y resumen de documentos legales Por qué Step Functions es ideal para flujos de trabajo de IA de varias etapas Mejores prácticas de seguridad y gobierno Valor empresarial del patrón de flujo de trabajo de IA de múltiples etapas

Patrón 4: flujo de trabajo de Multi-stage IA

Muchas aplicaciones de IA del mundo real no funcionan con un único modelo o función. Por el contrario, requieren una secuencia de AI-driven tareas, a menudo intercaladas con la lógica empresarial, las validaciones o las llamadas a las API de terceros. Estos flujos de trabajo de varias etapas son comunes en todos los sectores y casos de uso, entre los que se incluyen:

Procesos de análisis de documentos, como el reconocimiento óptico de caracteres (OCR), la clasificación, el resumen y la indexación
Sistemas de detección de fraudes, como los controles basados en reglas, pasando por el aprendizaje automático (ML), la puntuación y la lógica de escalamiento
La automatización de la atención médica, desde la obtención de imágenes hasta el diagnóstico, la generación de informes para su revisión por parte del médico
Flujos del procesamiento del lenguaje, como la transcripción, el análisis de sentimientos y la generación de respuestas

Sin embargo, estas canalizaciones pueden ser problemáticas porque suelen implicar lo siguiente:

Servicios heterogéneos, como el OCR, el procesamiento del lenguaje natural (NLP), la búsqueda vectorial y el aprendizaje automático personalizado
Múltiples tipos de modelos, como el ML tradicional y la IA generativa
Requisitos estrictos de auditoría y gestión de errores
Cross-functional propiedad, como la ciencia de datos, la ingeniería y el cumplimiento

Tradicionalmente, estos flujos de trabajo se implementan como código flexible o plataformas de orquestación estática. Este enfoque se traduce en una observabilidad deficiente, un acoplamiento estrecho y una agilidad reducida, así como en una sobrecarga operativa elevada para las actualizaciones y la recuperación de errores.

El patrón de flujo de trabajo de la IA en varias etapas: canalizaciones de IA modulares, observables y sin servidor

El patrón de flujo de trabajo de IA de múltiples etapas se utiliza AWS Step Functionscomo columna vertebral de la orquestación. Con este patrón, los equipos pueden coordinar una secuencia de tareas de IA como funciones modulares sin servidor, cada una de las cuales se activa y gestiona de forma independiente. Cada etapa del flujo de trabajo es observable, admite reintentos y está totalmente disociada de las demás etapas. El patrón de flujo de trabajo de IA de múltiples etapas permite lo siguiente:

Fine-grained control y gestión de errores
Plug-and-play integración de modelos, como cambiar un modelo de Amazon Bedrock sin tocar la orquestación
Separación clara de las preocupaciones entre tareas como el enriquecimiento y la inferencia
Repetibilidad, trazabilidad y alineación con el cumplimiento

La arquitectura de referencia implementa cada capa de la siguiente manera:

Activador de eventos: inicia una máquina de estados de Step Functions mediante la carga en Amazon S3 (por ejemplo, un archivo PDF), una llamada a la API o un trabajo programado.
Procesamiento: se utiliza AWS Lambdapara preparar metadatos, clasificar el tipo de archivo y enriquecer la entrada (por ejemplo, detectar el idioma de los documentos).
Inferencia: se produce en varias etapas, como Amazon Textract, Amazon Classifier y SageMaker Amazon Bedrock, resumen del modelo de lenguaje grande (LLM), todas encadenadas mediante Step Functions.
Post-processing- Utiliza Lambda para determinar el enrutamiento, como enviarlo al revisor, escalarlo a legal o aprobarlo automáticamente.
Salida: guarda los resultados en Amazon S3 o en los índices de Amazon OpenSearch Service. Emite eventos de auditoría a Amazon EventBridge para su registro y alertas.

Caso de uso: ingesta y resumen de documentos legales

Una firma de servicios legales recibe cientos de contratos a diario en diferentes formatos. Necesitan extraer y clasificar los tipos de documentos e identificar las cláusulas de riesgo. Además, deben resumir e indexar los documentos para su recuperación y enviarlos a los abogados en función de la puntuación de riesgo y el tipo de documento.

En respuesta a este caso de uso, la solución de flujo de trabajo de IA multietapa sigue estos pasos:

Al cargar un PDF, Amazon S3 pasa EventBridge a Step Functions.
Amazon Textract extrae el texto sin procesar del PDF.
El SageMaker modelo clasifica el tipo de documento, por ejemplo, un acuerdo de confidencialidad (NDA) o un acuerdo maestro de servicios (MSA).
Amazon Bedrock genera un resumen en lenguaje natural y una explicación de los riesgos.
Lambda determina la siguiente acción, como marcar para su revisión o autoprocesamiento.
Las salidas se registran en Amazon S3. Las alertas se emiten mediante Amazon Simple Notification Service (Amazon SNS) o. EventBridge

Por qué Step Functions es ideal para flujos de trabajo de IA de varias etapas

Step Functions ofrece las siguientes funciones y ventajas:

Generador visual de flujos de trabajo: permite mapear e iterar fácilmente la lógica empresarial
Built-in Reintentos y tiempos de espera: gestiona los errores posteriores del modelo sin problemas
Ejecución paralela: ejecuta varios modelos de inferencia de forma simultánea (por ejemplo, una traducción multilingüe)
Ramificación dinámica: rutas basadas en resultados de inferencias intermedios
Auditabilidad: permite una supervisión y un cumplimiento detallados mediante registros y métricas para cada paso

Mejores prácticas de seguridad y gobierno

Para garantizar que los procesos de IA sean seguros, auditables y estén alineados con las políticas, las organizaciones deben seguir estas mejores prácticas de seguridad y gobernanza:

Utilice AWS Identity and Access Management (IAM) por paso para aplicar el principio de privilegios mínimos en todos los servicios y funciones de Lambda.
Registre cada entrada y salida en Amazon CloudWatch Logs o Amazon S3 para permitir la trazabilidad, la depuración y la auditoría.
AWS CloudTrailIntégrelo para recopilar el historial de API-level acceso e invocación para realizar análisis forenses y de conformidad.
Aplique la validación del esquema entre etapas para garantizar la integridad de los datos, evitar la inyección o la desviación inmediata y reducir la propagación de los errores.

Valor empresarial del patrón de flujo de trabajo de IA de múltiples etapas

El patrón de flujo de trabajo de IA de múltiples etapas aporta valor en las siguientes áreas:

Agilidad: actualiza o reordena los pasos sin interrumpir el proceso.
Escalabilidad: se escala automáticamente según el volumen de los documentos mediante una arquitectura sin servidor.
Cumplimiento: proporciona una trazabilidad gradual de las acciones y las decisiones de IA.
Mantenibilidad: proporciona una base de código modular y alineada con el equipo. (Separar la lógica de la IA de la lógica de las políticas mejora la mantenibilidad, ya que permite gestionar de forma independiente el comportamiento dinámico de los modelos y las reglas empresariales deterministas. Este enfoque reduce el riesgo y permite que el equipo sea más responsable).
Integración: permite combinar el aprendizaje automático tradicional, las LLM y las API externas sin necesidad de acoplarlos.

El patrón de flujo de trabajo de la IA en varias etapas ofrece a las organizaciones una forma estructurada y escalable de crear canalizaciones de IA complejas, basándose en los principios de la ausencia de servidores y en las mejores prácticas operativas.

Este patrón proporciona la columna vertebral para crear AI-enhanced flujos de trabajo de nivel empresarial que sean seguros, observables y fáciles de evolucionar con el tiempo. Es compatible con varios casos de uso, desde la ingesta de documentos y la automatización de la incorporación hasta el análisis de riesgos y la elaboración de resultados contextuales a partir de varios modelos.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Patrón 3: Real-time inferencia en el borde

Patrón 5: Flujo de trabajo de IA basado en agentes