模式 4:多階段 AI 工作流程 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

模式 4:多階段 AI 工作流程

許多實際的 AI 應用程式不會由單一模型或函數提供。相反地,它們需要一系列 AI 驅動的任務,通常與商業邏輯、驗證或第三方 API 呼叫相互關聯。這些多階段工作流程在各產業和使用案例之間很常見,包括:

  • 文件分析管道,例如光學字元辨識 (OCR) 到分類,以摘要到索引

  • 詐騙偵測系統,例如規則型檢查到機器學習 (ML) 評分到呈報邏輯

  • 醫療保健自動化,例如影像到診斷,以向醫生審查報告產生

  • 語言處理流程,例如轉錄到情緒分析到回應產生

不過,這些管道可能有問題,因為它們通常涉及下列項目:

  • 異質服務,例如 OCR、自然語言處理 (NLP)、向量搜尋和自訂 ML

  • 多種模型類型,例如傳統 ML 和生成式 AI

  • 嚴格的稽核和錯誤處理要求

  • 跨功能擁有權,例如資料科學、工程和合規

傳統上,這些工作流程會實作為易碎的黏附程式碼或靜態協同運作平台。這種方法會導致可觀測性不佳、緊密耦合和低敏捷性,以及更新和錯誤復原的高營運開銷。

多階段 AI 工作流程模式:模組化、可觀測、無伺服器 AI 管道

多階段 AI 工作流程模式使用 AWS Step Functions做為協同運作骨幹。透過此模式,團隊可以將一系列 AI 任務協調為模組化、無伺服器函數,每個任務都會獨立觸發和管理。工作流程的每個階段都可觀察、支援重試,並與其他階段完全分離。多階段 AI 工作流程模式會啟用下列項目:

  • 精細控制和錯誤處理

  • Plug-and-play模型整合,例如在不接觸協同運作的情況下變更 Amazon Bedrock 模型

  • 明確分離富集和推論等任務之間的疑慮

  • 可重複性、可追蹤性和合規一致性

參考架構實作每一層,如下所示:

  • 事件觸發 - 透過 Amazon S3 上傳 (例如 PDF 檔案)、API 呼叫或排程任務啟動 Step Functions 狀態機器。

  • 處理 - 用於AWS Lambda準備中繼資料、分類檔案類型和充實輸入 (例如,偵測文件語言)。

  • 推論 – 以多個階段發生,例如 Amazon Textract 到 Amazon SageMaker 分類器到 Amazon Bedrock 大型語言模型 (LLM) 摘要器,全部使用 Step Functions 鏈結。

  • 後處理 - 使用 Lambda 來判斷路由,例如傳送給檢閱者、呈報至法務或自動核准。

  • 輸出 - 將結果儲存至 Amazon S3 或 Amazon OpenSearch Service 中的索引。向 Amazon EventBridge 發出稽核事件以進行記錄和提醒。

一家法律服務公司每天會收到數百份不同格式的合約。他們需要擷取和分類文件類型,並識別風險子句。此外,他們必須摘要和索引要擷取的文件,並根據風險分數和文件類型將其路由到律師。

為了回應此使用案例,多階段 AI 工作流程解決方案會遵循下列步驟:

  1. PDF 上傳會觸發 Amazon S3 到 EventBridge 到 Step Functions。

  2. Amazon Textract 會從 PDF 擷取原始文字。

  3. SageMaker 模型會分類文件類型,例如不公開協議 (NDA) 或主要服務協議 (MSA)。

  4. Amazon Bedrock 會產生自然語言摘要和風險說明。

  5. Lambda 會決定下一個動作,例如用於檢閱或自動處理的旗標。

  6. 輸出會記錄到 Amazon S3。使用 Amazon Simple Notification Service (Amazon SNS) 或 EventBridge 發出提醒。

為什麼 Step Functions 非常適合多階段 AI 工作流程

Step Functions 提供下列功能和優點:

  • 視覺化工作流程建置器 – 輕鬆映射和反覆運算商業邏輯

  • 內建重試和逾時 – 正常處理下游模型故障

  • 平行執行 – 同時執行多個推論模型 (例如,多語言轉譯)

  • 動態分支 – 根據中繼推論結果的路由

  • 稽核性 – 透過每個步驟的日誌和指標,實現精細的監控和合規

安全與控管最佳實務

為了確保安全、可稽核且符合政策的 AI 管道,組織應遵循下列安全與控管最佳實務:

  • 每個步驟使用 AWS Identity and Access Management (IAM),以強制執行所有服務和 Lambda 函數的最低權限原則。

  • 將每個輸入和輸出記錄到 Amazon CloudWatch Logs 或 Amazon S3,以啟用可追蹤性、偵錯和稽核。

  • 整合 AWS CloudTrail以擷取 API 層級存取和調用歷史記錄,以進行合規和鑑識分析。

  • 在階段之間套用結構描述驗證,以確保資料完整性、防止注入或提示偏離,並減少失敗傳播。

多階段 AI 工作流程模式的商業價值

多階段 AI 工作流程模式在下列區域中提供值:

  • 敏捷性 – 在不中斷管道的情況下更新或重新排序步驟。

  • 可擴展性 – 透過無伺服器架構自動擴展文件磁碟區。

  • 合規 – 提供動作和 AI 決策的step-by-step可追蹤性。

  • 維護性 – 提供模組化且團隊一致的程式碼基礎。(將 AI 邏輯與政策邏輯分開,透過允許獨立管理動態模型行為和決定性業務規則,改善可維護性。 這種方法可降低風險,並實現更明確的團隊擁有權。)

  • 整合 – 啟用傳統 ML、LLMs和外部 APIs的組合,無需耦合。

多階段 AI 工作流程模式為組織提供結構化、可擴展的方式來組合複雜的 AI 管道,以無伺服器原則和操作最佳實務為基礎。

此模式提供建置企業級 AI 增強型工作流程的骨幹,這些工作流程安全、可觀測且易於隨著時間演進。它支援各種使用案例,從擷取文件和自動化加入,到分析風險和編寫來自多個模型的情境輸出。