模式 1：無伺服器 ML 推論管道

在許多企業環境中，團隊需要將 AI 注入操作工作流程，例如，分類使用者意見回饋、偵測傳入遙測中的異常，或即時評分風險。這些採用機器學習 (ML) 的功能通常內嵌在面向客戶的應用程式、行動應用程式或內部自動化系統中。

不過，傳統的 ML 推論工作負載通常需要下列項目：

這些要求會導致下列情況：

此外，工程團隊通常缺乏專門的 ML 基礎設施技能來維持這種複雜性，而 AI 採用在原型階段停滯。

無伺服器 ML 推論模式：輕量、事件驅動、可擴展

無伺服器 ML 推論管道模式使用全受管、事件驅動的 AWS 服務模式來消除基礎設施負擔。此方法可啟用推論工作流程，這些工作流程只會在需要時觸發和執行，並根據需求自動擴展。

此模式非常適合執行下列任務：

參考架構實作每一層，如下所示：

事件觸發 – 將 Amazon API Gateway 用於使用者請求、將 Amazon EventBridge 用於商業事件，並將 Amazon S3 用於資料上傳。
處理層 – 實作 AWS Lambda來標準化輸入、驗證結構描述和豐富中繼資料。
推論層 – 部署 SageMaker Serverless Inference 端點以執行分類、迴歸或評分。
後置處理 – 使用 Lambda 來格式化回應、存放日誌和發出新事件。
輸出 – 實作 API Gateway 將結果傳回給使用者，或將事件發佈至 EventBridge 以進行下游處理。

此整個管道可以使用 AWS Cloud Development Kit (AWS CDK) 或 ()、版本控制和可觀察，以基礎設施形式部署為程式碼 AWS Serverless Application Model (IaC AWS SAM)。

一家全球電子商務公司想要將保留在產品評論或支援票證上的客戶意見回饋分類，以提早識別缺點並排定後續的優先順序。分類系統必須滿足下列要求：

在此使用案例中，無伺服器推論管道解決方案包含下列步驟：

無伺服器 ML 推論管道在下列領域提供價值：

無伺服器 ML 推論管道是許多希望以增量和實際方式採用 AI 的組織進入點。這是實現下列目標的理想模式：

透過抽象化基礎設施，團隊可以專注於商業邏輯、模型準確性和提供實際價值，而不會犧牲營運控制或可擴展性。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

設計無伺服器 AI 架構

模式 2：使用 Amazon Bedrock 進行代理式 AI 協調