Schéma 4 : flux de travail basé sur l'IA en plusieurs étapes - AWS Directives prescriptives

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Schéma 4 : flux de travail basé sur l'IA en plusieurs étapes

De nombreuses applications d'IA du monde réel ne sont pas desservies par un seul modèle ou une seule fonction. Ils nécessitent plutôt une séquence de tâches pilotées par l'IA, souvent associées à une logique métier, à des validations ou à des appels d'API tiers. Ces flux de travail en plusieurs étapes sont courants dans tous les secteurs et dans tous les cas d'utilisation, notamment :

  • Des pipelines d'analyse de documents tels que la reconnaissance optique de caractères (OCR), la classification, le résumé et l'indexation

  • Systèmes de détection des fraudes tels que les contrôles basés sur des règles, la notation par apprentissage automatique (ML) ou la logique d'escalade

  • Automatisation des soins de santé, comme l'imagerie, le diagnostic, la génération de rapports destinés à l'examen par le médecin

  • Flux de traitement du langage tels que la transcription, l'analyse des sentiments et la génération de réponses

Cependant, ces pipelines peuvent être problématiques car ils impliquent souvent les éléments suivants :

  • Services hétérogènes tels que l'OCR, le traitement du langage naturel (NLP), la recherche vectorielle et le ML personnalisé

  • Plusieurs types de modèles tels que le ML traditionnel et l'IA générative

  • Exigences strictes en matière d'audit et de gestion des erreurs

  • Propriété interfonctionnelle telle que la science des données, l'ingénierie et la conformité

Traditionnellement, ces flux de travail sont implémentés sous forme de code fragile ou de plateformes d'orchestration statiques. Cette approche entraîne une faible observabilité, un couplage étroit et une faible agilité, ainsi qu'une charge opérationnelle élevée pour les mises à jour et la correction des erreurs.

Le modèle de flux de travail d'IA en plusieurs étapes : pipelines d'IA modulaires, observables et sans serveur

Le modèle de flux de travail d'IA en plusieurs étapes est utilisé AWS Step Functionscomme colonne vertébrale de l'orchestration. Grâce à ce modèle, les équipes peuvent coordonner une séquence de tâches d'IA sous forme de fonctions modulaires sans serveur, chacune étant déclenchée et gérée indépendamment. Chaque étape du flux de travail est observable, prend en charge les nouvelles tentatives et est totalement découplée des autres étapes. Le modèle de flux de travail basé sur l'IA en plusieurs étapes permet les opérations suivantes :

  • Contrôle précis et gestion des erreurs

  • Plug-and-play intégration de modèles, telle que la modification d'un modèle Amazon Bedrock sans toucher à l'orchestration

  • Séparation claire des préoccupations entre les tâches telles que l'enrichissement et l'inférence

  • Répétabilité, traçabilité et harmonisation de la conformité

L'architecture de référence implémente chaque couche comme suit :

  • Déclencheur d'événements : lance une machine d'état Step Functions via le téléchargement sur Amazon S3 (par exemple, un fichier PDF), un appel d'API ou une tâche planifiée.

  • Traitement : permet AWS Lambdade préparer les métadonnées, de classer les types de fichiers et d'enrichir les entrées (par exemple, détecter la langue du document).

  • Inférence — Se produit en plusieurs étapes, telles que Amazon Textract to Amazon Classifier ou SageMaker Amazon Bedrock Large Language Model (LLM) Summarizer, le tout enchaîné à l'aide de Step Functions.

  • Post-traitement : utilise Lambda pour déterminer le routage, tel que l'envoi au réviseur, le transfert vers le statut légal ou l'approbation automatique.

  • Sortie : enregistre les résultats dans Amazon S3 ou dans les index d'Amazon OpenSearch Service. Envoie des événements d'audit à Amazon à des EventBridge fins de journalisation et d'alertes.

Un cabinet de services juridiques reçoit des centaines de contrats par jour sous différents formats. Ils doivent extraire et classer les types de documents et identifier les clauses de risque. En outre, ils doivent résumer et indexer les documents pour les récupérer et les transmettre aux avocats en fonction du niveau de risque et du type de document.

En réponse à ce cas d'utilisation, la solution de flux de travail AI en plusieurs étapes suit les étapes suivantes :

  1. Un téléchargement au format PDF déclenche la transition d'Amazon S3 EventBridge vers Step Functions.

  2. Amazon Textract extrait le texte brut du PDF.

  3. Le SageMaker modèle classe le type de document, par exemple un accord de confidentialité (NDA) ou un contrat-cadre de service (MSA).

  4. Amazon Bedrock génère un résumé en langage naturel et une explication des risques.

  5. Lambda détermine l'action suivante, telle que l'indicateur pour révision ou le traitement automatique.

  6. Les sorties sont enregistrées sur Amazon S3. Les alertes sont émises à l'aide d'Amazon Simple Notification Service (Amazon SNS) ou. EventBridge

Pourquoi Step Functions est idéal pour les flux de travail d'IA en plusieurs étapes

Step Functions propose les fonctionnalités et avantages suivants :

  • Générateur de flux de travail visuel : permet de cartographier et d'itérer facilement la logique métier

  • Rétentatives et délais d'attente intégrés : gère les défaillances des modèles en aval avec élégance

  • Exécution parallèle — Exécute simultanément plusieurs modèles d'inférence (par exemple, traduction multilingue)

  • Branchement dynamique — Routes basées sur des résultats d'inférence intermédiaires

  • Auditabilité : permet une surveillance et une conformité précises grâce à des journaux et à des mesures pour chaque étape

Bonnes pratiques en matière de sécurité et de gouvernance

Pour garantir des pipelines d'IA sécurisés, vérifiables et conformes aux politiques, les entreprises doivent suivre les meilleures pratiques de sécurité et de gouvernance suivantes :

  • Utilisez Gestion des identités et des accès AWS (IAM) par étape pour appliquer le principe du moindre privilège à tous les services et fonctions Lambda.

  • Enregistrez chaque entrée et sortie dans Amazon CloudWatch Logs ou Amazon S3 pour permettre la traçabilité, le débogage et l'audit.

  • Intégrez AWS CloudTrailpour capturer l'historique des accès et des appels au niveau de l'API à des fins de conformité et d'analyse médico-légale.

  • Appliquez la validation du schéma entre les étapes pour garantir l'intégrité des données, empêcher l'injection ou la dérive rapide et réduire la propagation des défaillances.

Valeur commerciale du modèle de flux de travail basé sur l'IA en plusieurs étapes

Le modèle de flux de travail basé sur l'IA en plusieurs étapes apporte de la valeur dans les domaines suivants :

  • Agilité — Met à jour ou réorganise les étapes sans perturber le pipeline.

  • Évolutivité — S'adapte automatiquement au volume de documents grâce à une architecture sans serveur.

  • Conformité — Assure step-by-step la traçabilité des actions et des décisions prises par l'IA.

  • Maintenabilité — Fournit une base de code modulaire et adaptée à l'équipe. (Séparer la logique de l'IA de la logique des politiques améliore la maintenabilité en permettant de gérer indépendamment le comportement dynamique du modèle et les règles métier déterministes. Cette approche réduit les risques et permet de mieux s'approprier l'équipe.)

  • Intégration — Permet de combiner le ML traditionnel et LLMs le ML externe APIs sans couplage.

Le modèle de flux de travail d'IA en plusieurs étapes offre aux entreprises un moyen structuré et évolutif d'assembler des pipelines d'IA complexes, sur la base des principes du sans serveur et des meilleures pratiques opérationnelles.

Ce modèle constitue la base de la création de flux de travail optimisés par l'IA de qualité professionnelle, sécurisés, observables et faciles à faire évoluer au fil du temps. Il prend en charge divers cas d'utilisation, de l'ingestion de documents à l'automatisation de l'intégration, en passant par l'analyse des risques et la rédaction de résultats contextuels à partir de plusieurs modèles.