Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Modello 4: flusso di lavoro AI in più fasi
Molte applicazioni di intelligenza artificiale del mondo reale non sono servite da un singolo modello o funzione. Richiedono invece una sequenza di attività basate sull'intelligenza artificiale, spesso interconnesse alla logica aziendale, alle convalide o alle chiamate API di terze parti. Questi flussi di lavoro in più fasi sono comuni in tutti i settori e i casi d'uso, tra cui:
-
Pipeline di analisi dei documenti, come il riconoscimento ottico dei caratteri (OCR), dalla classificazione al riepilogo all'indicizzazione
-
Sistemi di rilevamento delle frodi, come i controlli basati su regole, il machine learning (ML), il punteggio e la logica di escalation
-
Automazione sanitaria, ad esempio dall'imaging alla diagnosi, dalla generazione di report alla revisione medica
-
Flussi di elaborazione del linguaggio, ad esempio dalla trascrizione all'analisi dei sentimenti fino alla generazione di risposte
Tuttavia, queste pipeline possono essere problematiche perché spesso implicano quanto segue:
-
Servizi eterogenei come OCR, elaborazione del linguaggio naturale (NLP), ricerca vettoriale e ML personalizzato
-
Diversi tipi di modelli come il machine learning tradizionale e l'intelligenza artificiale generativa
-
Requisiti rigorosi di controllo e gestione degli errori
-
Proprietà interfunzionale, ad esempio scienza dei dati, ingegneria e conformità
Tradizionalmente, questi flussi di lavoro sono implementati come fragili code o piattaforme di orchestrazione statiche. Questo approccio comporta scarsa osservabilità, accoppiamento stretto, bassa agilità e un elevato sovraccarico operativo per gli aggiornamenti e il ripristino degli errori.
Il modello di flusso di lavoro dell'IA in più fasi: pipeline di intelligenza artificiale modulari, osservabili e senza server
Il modello di flusso di lavoro AI a più stadi viene utilizzato AWS Step Functionscome spina dorsale di orchestrazione. Con questo modello, i team possono coordinare una sequenza di attività di intelligenza artificiale sotto forma di funzioni modulari e senza server, ciascuna attivata e gestita in modo indipendente. Ogni fase del flusso di lavoro è osservabile, supporta nuovi tentativi ed è completamente disaccoppiata dalle altre fasi. Il modello di flusso di lavoro AI in più fasi consente quanto segue:
-
Controllo e gestione degli errori dettagliati
-
Plug-and-play integrazione di modelli, ad esempio la modifica di un modello Amazon Bedrock senza toccare l'orchestrazione
-
Chiara separazione delle preoccupazioni tra attività come l'arricchimento e l'inferenza
-
Ripetibilità, tracciabilità e allineamento alla conformità
L'architettura di riferimento implementa ogni livello come segue:
-
Event trigger: avvia una macchina a stati Step Functions tramite il caricamento di Amazon S3 (ad esempio, un file PDF), una chiamata API o un processo pianificato.
-
Elaborazione: consente AWS Lambdadi preparare i metadati, classificare il tipo di file e arricchire l'input (ad esempio, rilevare la lingua del documento).
-
Inferenza: avviene in più fasi, ad esempio dal classificatore Amazon Textract ad SageMaker Amazon al riepilogo LLM (Large Language Model) di Amazon Bedrock, il tutto concatenato utilizzando Step Functions.
-
Postelaborazione: utilizza Lambda per determinare il routing, ad esempio l'invio al revisore, l'escalation to legal o l'approvazione automatica.
-
Output: salva i risultati in Amazon S3 o negli indici in Amazon Service. OpenSearch Invia eventi di controllo ad Amazon EventBridge per la registrazione e gli avvisi.
Caso d'uso: inserimento e riepilogo di documenti legali
Una società di servizi legali riceve centinaia di contratti ogni giorno in diversi formati. Devono estrarre e classificare i tipi di documenti e identificare le clausole di rischio. Inoltre, devono riepilogare e indicizzare i documenti per il recupero e inviarli agli avvocati in base al punteggio di rischio e al tipo di documento.
In risposta a questo caso d'uso, la soluzione di flusso di lavoro AI in più fasi segue questi passaggi:
-
Un caricamento di un PDF attiva Amazon S3 EventBridge su Step Functions.
-
Amazon Textract estrae il testo non elaborato dal PDF.
-
Il SageMaker modello classifica il tipo di documento, ad esempio un accordo di non divulgazione (NDA) o un contratto di servizio principale (MSA).
-
Amazon Bedrock genera un riepilogo in linguaggio naturale e una spiegazione del rischio.
-
Lambda determina l'azione successiva, ad esempio la segnalazione di revisione o l'elaborazione automatica.
-
Gli output vengono registrati su Amazon S3. Gli avvisi vengono emessi utilizzando Amazon Simple Notification Service (Amazon SNS) o. EventBridge
Perché Step Functions è ideale per i flussi di lavoro AI in più fasi
Step Functions offre le seguenti funzionalità e vantaggi:
-
Generatore visivo di flussi di lavoro: consente una facile mappatura e iterazione della logica aziendale
-
Ritentativi e timeout integrati: consente di gestire gli errori del modello a valle in modo corretto
-
Esecuzione parallela: esegue più modelli di inferenza contemporaneamente (ad esempio, traduzione multilingue)
-
Ramificazione dinamica: percorsi basati su risultati di inferenza intermedi
-
Verificabilità: consente il monitoraggio e la conformità dettagliati tramite log e metriche per ogni fase
Migliori pratiche di sicurezza e governance
Per garantire pipeline di intelligenza artificiale sicure, verificabili e allineate alle politiche, le organizzazioni devono seguire queste migliori pratiche di sicurezza e governance:
-
Utilizza AWS Identity and Access Management (IAM) per fase per applicare il principio del privilegio minimo su tutti i servizi e le funzioni Lambda.
-
Registra ogni input e output su Amazon CloudWatch Logs o Amazon S3 per consentire la tracciabilità, il debug e l'audit.
-
Effettua AWS CloudTraill'integrazione per acquisire la cronologia degli accessi e delle chiamate a livello di API per la conformità e l'analisi forense.
-
Applica la convalida dello schema tra le fasi per garantire l'integrità dei dati, prevenire l'iniezione o la rapida deriva e ridurre la propagazione degli errori.
Valore aziendale del modello di flusso di lavoro AI in più fasi
Il modello di flusso di lavoro AI in più fasi offre valore nelle seguenti aree:
-
Agilità: aggiorna o riordina le fasi senza interrompere la pipeline.
-
Scalabilità: scalabilità automatica in base al volume dei documenti tramite un'architettura serverless.
-
Conformità: fornisce la step-by-step tracciabilità delle azioni e delle decisioni di intelligenza artificiale.
-
Manutenibilità: fornisce una base di codice modulare e allineata al team. (La separazione della logica dell'intelligenza artificiale dalla logica delle politiche migliora la manutenibilità consentendo di gestire in modo indipendente il comportamento dinamico del modello e le regole aziendali deterministiche. Questo approccio riduce i rischi e consente una più chiara titolarità del team.)
-
Integrazione: consente combinazioni di ML tradizionale ed esterno APIs senza accoppiamento. LLMs
Il modello di flusso di lavoro basato sull'intelligenza artificiale in più fasi offre alle organizzazioni un modo strutturato e scalabile per assemblare pipeline di intelligenza artificiale complesse, basato su principi serverless e best practice operative.
Questo modello fornisce la spina dorsale per la creazione di flussi di lavoro di livello aziendale potenziati dall'intelligenza artificiale, sicuri, osservabili e facili da evolvere nel tempo. Supporta vari casi d'uso, dall'acquisizione di documenti e dall'automazione dell'onboarding all'analisi dei rischi e alla composizione di output contestuali da più modelli.