Le modèle de flux de travail d'IA en plusieurs étapes : pipelines d'IA modulaires, observables et sans serveur Cas d'utilisation : ingestion et synthèse de documents juridiques Pourquoi Step Functions est idéal pour les flux de travail d'IA en plusieurs étapes Bonnes pratiques en matière de sécurité et de gouvernance Valeur commerciale du modèle de flux de travail basé sur l'IA en plusieurs étapes

Schéma 4 : flux de travail basé sur Multi-stage l'IA

De nombreuses applications d'IA du monde réel ne sont pas desservies par un seul modèle ou une seule fonction. Ils nécessitent plutôt une séquence de AI-driven tâches, souvent imbriquées dans une logique métier, des validations ou des appels d'API tiers. Ces flux de travail en plusieurs étapes sont courants dans tous les secteurs et dans tous les cas d'utilisation, notamment :

Des pipelines d'analyse de documents tels que la reconnaissance optique de caractères (OCR), la classification, le résumé et l'indexation
Systèmes de détection des fraudes tels que les contrôles basés sur des règles, la notation par apprentissage automatique (ML) ou la logique d'escalade
Automatisation des soins de santé, comme l'imagerie, le diagnostic, la génération de rapports destinés à l'examen par le médecin
Flux de traitement du langage tels que la transcription, l'analyse des sentiments et la génération de réponses

Cependant, ces pipelines peuvent être problématiques car ils impliquent souvent les éléments suivants :

Services hétérogènes tels que l'OCR, le traitement du langage naturel (NLP), la recherche vectorielle et le ML personnalisé
Plusieurs types de modèles tels que le ML traditionnel et l'IA générative
Exigences strictes en matière d'audit et de gestion des erreurs
Cross-functional propriété telle que la science des données, l'ingénierie et la conformité

Traditionnellement, ces flux de travail sont implémentés sous forme de code fragile ou de plateformes d'orchestration statiques. Cette approche entraîne une faible observabilité, un couplage étroit et une faible agilité, ainsi qu'une charge opérationnelle élevée pour les mises à jour et la correction des erreurs.

Le modèle de flux de travail d'IA en plusieurs étapes : pipelines d'IA modulaires, observables et sans serveur

Le modèle de flux de travail d'IA en plusieurs étapes est utilisé AWS Step Functionscomme colonne vertébrale de l'orchestration. Grâce à ce modèle, les équipes peuvent coordonner une séquence de tâches d'IA sous forme de fonctions modulaires sans serveur, chacune étant déclenchée et gérée indépendamment. Chaque étape du flux de travail est observable, prend en charge les nouvelles tentatives et est totalement découplée des autres étapes. Le modèle de flux de travail basé sur l'IA en plusieurs étapes permet les opérations suivantes :

Fine-grained contrôle et gestion des erreurs
Plug-and-play intégration de modèles, telle que la modification d'un modèle Amazon Bedrock sans toucher à l'orchestration
Séparation claire des préoccupations entre les tâches telles que l'enrichissement et l'inférence
Répétabilité, traçabilité et harmonisation de la conformité

L'architecture de référence implémente chaque couche comme suit :

Déclencheur d'événements : lance une machine d'état Step Functions via le téléchargement sur Amazon S3 (par exemple, un fichier PDF), un appel d'API ou une tâche planifiée.
Traitement : permet AWS Lambdade préparer les métadonnées, de classer les types de fichiers et d'enrichir les entrées (par exemple, détecter la langue du document).
Inférence — Se produit en plusieurs étapes, telles que Amazon Textract to Amazon Classifier ou SageMaker Amazon Bedrock Large Language Model (LLM) Summarizer, le tout enchaîné à l'aide de Step Functions.
Post-processing- Utilise Lambda pour déterminer le routage, tel que l'envoi au réviseur, le transfert vers le statut légal ou l'approbation automatique.
Sortie : enregistre les résultats dans Amazon S3 ou dans les index d'Amazon OpenSearch Service. Envoie des événements d'audit à Amazon à des EventBridge fins de journalisation et d'alertes.

Cas d'utilisation : ingestion et synthèse de documents juridiques

Un cabinet de services juridiques reçoit des centaines de contrats par jour sous différents formats. Ils doivent extraire et classer les types de documents et identifier les clauses de risque. En outre, ils doivent résumer et indexer les documents pour les récupérer et les transmettre aux avocats en fonction du niveau de risque et du type de document.

En réponse à ce cas d'utilisation, la solution de flux de travail AI en plusieurs étapes suit les étapes suivantes :

Un téléchargement au format PDF déclenche la transition d'Amazon S3 EventBridge vers Step Functions.
Amazon Textract extrait le texte brut du PDF.
Le SageMaker modèle classe le type de document, par exemple un accord de confidentialité (NDA) ou un contrat-cadre de service (MSA).
Amazon Bedrock génère un résumé en langage naturel et une explication des risques.
Lambda détermine l'action suivante, telle que l'indicateur pour révision ou le traitement automatique.
Les sorties sont enregistrées sur Amazon S3. Les alertes sont émises à l'aide d'Amazon Simple Notification Service (Amazon SNS) ou. EventBridge

Pourquoi Step Functions est idéal pour les flux de travail d'IA en plusieurs étapes

Step Functions propose les fonctionnalités et avantages suivants :

Générateur de flux de travail visuel : permet de cartographier et d'itérer facilement la logique métier
Built-in nouvelles tentatives et délais d'attente : gère les défaillances du modèle en aval avec élégance
Exécution parallèle — Exécute simultanément plusieurs modèles d'inférence (par exemple, traduction multilingue)
Branchement dynamique — Routes basées sur des résultats d'inférence intermédiaires
Auditabilité : permet une surveillance et une conformité précises grâce à des journaux et à des mesures pour chaque étape

Bonnes pratiques en matière de sécurité et de gouvernance

Pour garantir des pipelines d'IA sécurisés, vérifiables et conformes aux politiques, les entreprises doivent suivre les meilleures pratiques de sécurité et de gouvernance suivantes :

Utilisez Gestion des identités et des accès AWS (IAM) par étape pour appliquer le principe du moindre privilège à tous les services et fonctions Lambda.
Enregistrez chaque entrée et sortie dans Amazon CloudWatch Logs ou Amazon S3 pour permettre la traçabilité, le débogage et l'audit.
Intégrez AWS CloudTrailpour capturer l'historique des API-level accès et des invocations à des fins d'analyse de conformité et de criminalistique.
Appliquez la validation du schéma entre les étapes pour garantir l'intégrité des données, empêcher l'injection ou la dérive rapide et réduire la propagation des défaillances.

Valeur commerciale du modèle de flux de travail basé sur l'IA en plusieurs étapes

Le modèle de flux de travail basé sur l'IA en plusieurs étapes apporte de la valeur dans les domaines suivants :

Agilité — Met à jour ou réorganise les étapes sans perturber le pipeline.
Évolutivité — S'adapte automatiquement au volume de documents grâce à une architecture sans serveur.
Conformité : fournit une traçabilité étape par étape des actions et des décisions prises par l'IA.
Maintenabilité — Fournit une base de code modulaire et adaptée à l'équipe. (Séparer la logique de l'IA de la logique des politiques améliore la maintenabilité en permettant de gérer indépendamment le comportement dynamique du modèle et les règles métier déterministes. Cette approche réduit les risques et permet une prise en charge plus claire de l'équipe.)
Intégration : permet de combiner le ML traditionnel, le LLM et les API externes sans couplage.

Le modèle de flux de travail d'IA en plusieurs étapes offre aux entreprises un moyen structuré et évolutif d'assembler des pipelines d'IA complexes, sur la base des principes du sans serveur et des meilleures pratiques opérationnelles.

Ce modèle constitue la base de la création de AI-enhanced flux de travail professionnels sécurisés, observables et faciles à faire évoluer au fil du temps. Il prend en charge divers cas d'utilisation, de l'ingestion de documents à l'automatisation de l'intégration, en passant par l'analyse des risques et la rédaction de résultats contextuels à partir de plusieurs modèles.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Schéma 3 : Real-time inférence sur le bord

Schéma 5 : flux de travail basé sur l'IA pour agents