Il modello di flusso di lavoro dell'IA in più fasi: pipeline di intelligenza artificiale modulari, osservabili e senza server Caso d'uso: inserimento e riepilogo di documenti legali Perché Step Functions è ideale per i flussi di lavoro AI in più fasi Migliori pratiche di sicurezza e governance Valore aziendale del modello di flusso di lavoro AI in più fasi

Modello 4: flusso di lavoro basato sull' Multi-stage intelligenza artificiale

Molte applicazioni di intelligenza artificiale del mondo reale non sono servite da un singolo modello o funzione. Richiedono invece una sequenza di AI-driven attività, spesso interconnesse alla logica aziendale, alle convalide o alle chiamate API di terze parti. Questi flussi di lavoro in più fasi sono comuni a tutti i settori e i casi d'uso, tra cui:

Pipeline di analisi dei documenti, come il riconoscimento ottico dei caratteri (OCR), dalla classificazione al riepilogo all'indicizzazione
Sistemi di rilevamento delle frodi, come i controlli basati su regole, il machine learning (ML), il punteggio e la logica di escalation
Automazione sanitaria, ad esempio dall'imaging alla diagnosi, dalla generazione di report alla revisione medica
Flussi di elaborazione del linguaggio, ad esempio dalla trascrizione all'analisi dei sentimenti fino alla generazione di risposte

Tuttavia, queste pipeline possono essere problematiche perché spesso implicano quanto segue:

Servizi eterogenei come OCR, elaborazione del linguaggio naturale (NLP), ricerca vettoriale e ML personalizzato
Diversi tipi di modelli come il machine learning tradizionale e l'intelligenza artificiale generativa
Requisiti rigorosi di controllo e gestione degli errori
Cross-functional proprietà, ad esempio scienza dei dati, progettazione e conformità

Tradizionalmente, questi flussi di lavoro sono implementati come fragili code o piattaforme di orchestrazione statica. Questo approccio comporta una scarsa osservabilità, un accoppiamento stretto, una bassa agilità e un elevato sovraccarico operativo per gli aggiornamenti e il ripristino degli errori.

Il modello di flusso di lavoro dell'IA in più fasi: pipeline di intelligenza artificiale modulari, osservabili e senza server

Il modello di flusso di lavoro AI a più stadi viene utilizzato AWS Step Functionscome spina dorsale di orchestrazione. Con questo modello, i team possono coordinare una sequenza di attività di intelligenza artificiale sotto forma di funzioni modulari e senza server, ciascuna attivata e gestita in modo indipendente. Ogni fase del flusso di lavoro è osservabile, supporta nuovi tentativi ed è completamente disaccoppiata dalle altre fasi. Il modello di flusso di lavoro AI in più fasi consente quanto segue:

Fine-grained controllo e gestione degli errori
Plug-and-play integrazione di modelli, ad esempio la modifica di un modello Amazon Bedrock senza toccare l'orchestrazione
Chiara separazione delle preoccupazioni tra attività come l'arricchimento e l'inferenza
Ripetibilità, tracciabilità e allineamento alla conformità

L'architettura di riferimento implementa ogni livello come segue:

Event trigger: avvia una macchina a stati Step Functions tramite il caricamento di Amazon S3 (ad esempio, un file PDF), una chiamata API o un processo pianificato.
Elaborazione: consente AWS Lambdadi preparare i metadati, classificare il tipo di file e arricchire l'input (ad esempio, rilevare la lingua del documento).
Inferenza: avviene in più fasi, ad esempio dal classificatore Amazon Textract ad SageMaker Amazon al riepilogo LLM (Large Language Model) di Amazon Bedrock, il tutto concatenato utilizzando Step Functions.
Post-processing- Utilizza Lambda per determinare il routing, ad esempio l'invio al revisore, l'inoltro a legale o l'approvazione automatica.
Output: salva i risultati in Amazon S3 o negli indici in Amazon Service. OpenSearch Invia eventi di controllo ad Amazon EventBridge per la registrazione e gli avvisi.

Caso d'uso: inserimento e riepilogo di documenti legali

Una società di servizi legali riceve centinaia di contratti ogni giorno in diversi formati. Devono estrarre e classificare i tipi di documenti e identificare le clausole di rischio. Inoltre, devono riepilogare e indicizzare i documenti per il recupero e inviarli agli avvocati in base al punteggio di rischio e al tipo di documento.

In risposta a questo caso d'uso, la soluzione di flusso di lavoro AI in più fasi segue questi passaggi:

Un caricamento di un PDF attiva Amazon S3 EventBridge su Step Functions.
Amazon Textract estrae il testo non elaborato dal PDF.
Il SageMaker modello classifica il tipo di documento, ad esempio un accordo di non divulgazione (NDA) o un contratto di servizio principale (MSA).
Amazon Bedrock genera un riepilogo in linguaggio naturale e una spiegazione del rischio.
Lambda determina l'azione successiva, ad esempio la segnalazione di revisione o l'elaborazione automatica.
Gli output vengono registrati su Amazon S3. Gli avvisi vengono emessi utilizzando Amazon Simple Notification Service (Amazon SNS) o. EventBridge

Perché Step Functions è ideale per i flussi di lavoro AI in più fasi

Step Functions offre le seguenti funzionalità e vantaggi:

Generatore visivo di flussi di lavoro: consente una facile mappatura e iterazione della logica aziendale
Built-in tentativi e timeout: gestisce con garbo gli errori del modello a valle
Esecuzione parallela: esegue più modelli di inferenza contemporaneamente (ad esempio, traduzione multilingue)
Ramificazione dinamica: percorsi basati su risultati di inferenza intermedi
Verificabilità: consente il monitoraggio e la conformità dettagliati tramite log e metriche per ogni fase

Migliori pratiche di sicurezza e governance

Per garantire pipeline di intelligenza artificiale sicure, verificabili e allineate alle politiche, le organizzazioni devono seguire queste migliori pratiche di sicurezza e governance:

Utilizza AWS Identity and Access Management (IAM) per fase per applicare il principio del privilegio minimo su tutti i servizi e le funzioni Lambda.
Registra ogni input e output su Amazon CloudWatch Logs o Amazon S3 per consentire la tracciabilità, il debug e l'audit.
Effettua l'integrazione AWS CloudTrailper acquisire la cronologia degli API-level accessi e delle chiamate per la conformità e l'analisi forense.
Applica la convalida dello schema tra le fasi per garantire l'integrità dei dati, prevenire l'iniezione o la rapida deriva e ridurre la propagazione degli errori.

Valore aziendale del modello di flusso di lavoro AI in più fasi

Il modello di flusso di lavoro AI in più fasi offre valore nelle seguenti aree:

Agilità: aggiorna o riordina le fasi senza interrompere la pipeline.
Scalabilità: scalabilità automatica in base al volume dei documenti tramite un'architettura serverless.
Conformità: fornisce la tracciabilità dettagliata delle azioni e delle decisioni di intelligenza artificiale.
Manutenibilità: fornisce una base di codice modulare e allineata al team. (Separare la logica dell'intelligenza artificiale dalla logica delle politiche migliora la manutenibilità consentendo di gestire in modo indipendente il comportamento dinamico del modello e le regole aziendali deterministiche. Questo approccio riduce i rischi e consente una più chiara titolarità del team.)
Integrazione: consente combinazioni di ML tradizionali, LLM e API esterne senza accoppiamento.

Il modello di flusso di lavoro basato sull'intelligenza artificiale in più fasi offre alle organizzazioni un modo strutturato e scalabile per assemblare pipeline di intelligenza artificiale complesse, basato sui principi serverless e sulle migliori pratiche operative.

Questo modello fornisce la spina dorsale per la creazione di AI-enhanced flussi di lavoro di livello aziendale sicuri, osservabili e facili da evolvere nel tempo. Supporta vari casi d'uso, dall'acquisizione di documenti e dall'automazione dell'onboarding all'analisi dei rischi e alla composizione di output contestuali da più modelli.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Schema 3: Real-time inferenza sul bordo

Modello 5: flusso di lavoro basato sull'intelligenza artificiale degli agenti