Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Patrón 4: flujo de trabajo de IA en varias etapas
Muchas aplicaciones de IA del mundo real no funcionan con un único modelo o función. Por el contrario, requieren una secuencia de tareas impulsadas por la IA, a menudo intercaladas con la lógica empresarial, las validaciones o las llamadas a las API de terceros. Estos flujos de trabajo de varias etapas son comunes en todos los sectores y casos de uso, entre los que se incluyen:
-
Procesos de análisis de documentos, como el reconocimiento óptico de caracteres (OCR), la clasificación, el resumen y la indexación
-
Sistemas de detección de fraudes, como los controles basados en reglas, pasando por el aprendizaje automático (ML), la puntuación y la lógica de escalamiento
-
La automatización de la atención médica, desde la obtención de imágenes hasta el diagnóstico, la generación de informes para su revisión por parte del médico
-
Flujos del procesamiento del lenguaje, como la transcripción, el análisis de sentimientos y la generación de respuestas
Sin embargo, estas canalizaciones pueden ser problemáticas porque suelen implicar lo siguiente:
-
Servicios heterogéneos, como el OCR, el procesamiento del lenguaje natural (NLP), la búsqueda vectorial y el aprendizaje automático personalizado
-
Múltiples tipos de modelos, como el ML tradicional y la IA generativa
-
Requisitos estrictos de auditoría y gestión de errores
-
Propiedad interfuncional, como la ciencia de datos, la ingeniería y el cumplimiento
Tradicionalmente, estos flujos de trabajo se implementan como código flexible o plataformas de orquestación estática. Este enfoque se traduce en una observabilidad deficiente, un acoplamiento estrecho y una agilidad reducida, así como en una sobrecarga operativa elevada para las actualizaciones y la recuperación de errores.
El patrón de flujo de trabajo de la IA en varias etapas: canalizaciones de IA modulares, observables y sin servidor
El patrón de flujo de trabajo de IA de múltiples etapas se utiliza AWS Step Functionscomo columna vertebral de la orquestación. Con este patrón, los equipos pueden coordinar una secuencia de tareas de IA como funciones modulares sin servidor, cada una de las cuales se activa y gestiona de forma independiente. Cada etapa del flujo de trabajo es observable, admite reintentos y está totalmente disociada de las demás etapas. El patrón de flujo de trabajo de IA de múltiples etapas permite lo siguiente:
-
Control detallado y gestión de errores
-
Plug-and-play integración de modelos, como cambiar un modelo de Amazon Bedrock sin tocar la orquestación
-
Separación clara de las preocupaciones entre tareas como el enriquecimiento y la inferencia
-
Repetibilidad, trazabilidad y alineación con el cumplimiento
La arquitectura de referencia implementa cada capa de la siguiente manera:
-
Activador de eventos: inicia una máquina de estados de Step Functions mediante la carga en Amazon S3 (por ejemplo, un archivo PDF), una llamada a la API o un trabajo programado.
-
Procesamiento: se utiliza AWS Lambdapara preparar metadatos, clasificar el tipo de archivo y enriquecer la entrada (por ejemplo, detectar el idioma de los documentos).
-
Inferencia: se produce en varias etapas, como Amazon Textract, Amazon Classifier y SageMaker Amazon Bedrock, resumen del modelo de lenguaje grande (LLM), todas encadenadas mediante Step Functions.
-
Posprocesamiento: utiliza Lambda para determinar el enrutamiento, como enviarlo al revisor, escalarlo a legal o aprobarlo automáticamente.
-
Salida: guarda los resultados en Amazon S3 o en los índices de Amazon OpenSearch Service. Emite eventos de auditoría a Amazon EventBridge para su registro y alertas.
Caso de uso: ingesta y resumen de documentos legales
Una firma de servicios legales recibe cientos de contratos a diario en diferentes formatos. Necesitan extraer y clasificar los tipos de documentos e identificar las cláusulas de riesgo. Además, deben resumir e indexar los documentos para su recuperación y enviarlos a los abogados en función de la puntuación de riesgo y el tipo de documento.
En respuesta a este caso de uso, la solución de flujo de trabajo de IA multietapa sigue estos pasos:
-
Al cargar un PDF, Amazon S3 pasa EventBridge a Step Functions.
-
Amazon Textract extrae el texto sin procesar del PDF.
-
El SageMaker modelo clasifica el tipo de documento, por ejemplo, un acuerdo de confidencialidad (NDA) o un acuerdo maestro de servicios (MSA).
-
Amazon Bedrock genera un resumen en lenguaje natural y una explicación de los riesgos.
-
Lambda determina la siguiente acción, como marcar para su revisión o autoprocesamiento.
-
Las salidas se registran en Amazon S3. Las alertas se emiten mediante Amazon Simple Notification Service (Amazon SNS) o. EventBridge
Por qué Step Functions es ideal para flujos de trabajo de IA de varias etapas
Step Functions ofrece las siguientes funciones y ventajas:
-
Generador visual de flujos de trabajo: permite mapear e iterar fácilmente la lógica empresarial
-
Reintentos y tiempos de espera integrados: gestiona los errores posteriores del modelo sin problemas
-
Ejecución paralela: ejecuta varios modelos de inferencia de forma simultánea (por ejemplo, la traducción multilingüe)
-
Ramificación dinámica: rutas basadas en resultados de inferencias intermedios
-
Auditabilidad: permite una supervisión y un cumplimiento detallados mediante registros y métricas para cada paso
Mejores prácticas de seguridad y gobierno
Para garantizar que los procesos de IA sean seguros, auditables y estén alineados con las políticas, las organizaciones deben seguir estas prácticas recomendadas de seguridad y gobernanza:
-
Utilice AWS Identity and Access Management (IAM) por paso para aplicar el principio de privilegios mínimos en todos los servicios y funciones de Lambda.
-
Registre cada entrada y salida en Amazon CloudWatch Logs o Amazon S3 para permitir la trazabilidad, la depuración y la auditoría.
-
AWS CloudTrailIntégrelo para recopilar el historial de accesos e invocaciones a nivel de API para realizar análisis forenses y de conformidad.
-
Aplique la validación del esquema entre etapas para garantizar la integridad de los datos, evitar la inyección o la desviación inmediata y reducir la propagación de los errores.
Valor empresarial del patrón de flujo de trabajo de IA de múltiples etapas
El patrón de flujo de trabajo de IA de múltiples etapas aporta valor en las siguientes áreas:
-
Agilidad: actualiza o reordena los pasos sin interrumpir el proceso.
-
Escalabilidad: se escala automáticamente según el volumen de los documentos mediante una arquitectura sin servidor.
-
Cumplimiento: proporciona la step-by-step trazabilidad de las acciones y las decisiones de IA.
-
Mantenibilidad: proporciona una base de código modular y alineada con el equipo. (Separar la lógica de la IA de la lógica de las políticas mejora la mantenibilidad, ya que permite gestionar de forma independiente el comportamiento dinámico de los modelos y las reglas empresariales deterministas. Este enfoque reduce el riesgo y permite que el equipo sea más responsable).
-
Integración: permite combinar el aprendizaje automático tradicional y el externo APIs sin ningún tipo de acoplamiento. LLMs
El patrón de flujo de trabajo de la IA en varias etapas ofrece a las organizaciones una forma estructurada y escalable de crear canalizaciones de IA complejas, basándose en los principios de la ausencia de servidores y en las mejores prácticas operativas.
Este patrón proporciona la columna vertebral para crear flujos de trabajo de nivel empresarial mejorados con IA que sean seguros, observables y fáciles de evolucionar con el tiempo. Es compatible con varios casos de uso, desde la ingesta de documentos y la automatización de la incorporación hasta el análisis de riesgos y la elaboración de resultados contextuales a partir de varios modelos.