本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 上建置代理式 AI 的無伺服器架構 AWS
Aaron Sempf,Amazon Web Services
2026 年 1 月 (文件歷史記錄)
AI 和無伺服器運算的融合正在重塑現代企業架構的前景。為了回應,組織正在努力大規模提供智慧型功能。他們面臨越來越大的壓力,以減少營運開銷、加速創新,以及部署可即時適應使用者行為和系統事件的應用程式。
上的無伺服器 AI AWS 代表智慧、適應性、雲端原生系統的基本轉變。透過正確的策略和工具,組織可以釋放更快的創新週期、降低成本和更大的可擴展性。這種方法將它們定位在新一代企業運算的最前線。 透過結合全受管 AI 服務和事件驅動的無伺服器基礎設施來 AWS 實現此轉移。
本指南概述在 上建置 AI 原生、無伺服器架構的策略和技術基礎 AWS。這些架構可擴展、經濟實惠,能夠提供即時智慧,而無需複雜的基礎設施管理。
目標對象
本指南適用於尋求在現代雲端原生應用程式中利用 AI 驅動軟體代理程式的架構師、開發人員和技術領導者。
目標
本指南可協助您執行以下操作:
-
了解可用於代理式 AI AWS 解決方案開發的原生服務
-
使用雲端規模可靠性操作代理式 AI
-
使 AI 執行與業務成果和成本模型保持一致
-
建立安全、受管 AI 採用的架構
關於此內容系列
本指南是代理式 AI 相關系列的一部分 AWS。如需詳細資訊和檢視此系列中的其他指南,請參閱 AWS 方案指引網站上的 客服人員 AI
無伺服器 AI 的商業案例
無伺服器運算為現代 AI 工作負載提供了理想的基礎。AI 應用程式通常需要間歇性、運算密集的推論,尤其是在詐騙偵測、建議引擎、文件摘要和客戶服務自動化等使用案例中。傳統基礎設施模型在管理無法預測或尖峰工作負載時,可能非常昂貴且操作複雜。
相比之下,無伺服器架構具有顯著的優勢。它們會自動擴展、隨需執行、降低營運開銷,以及僅針對使用的資源收取費用。這些功能使無伺服器架構非常適合將 AI 嵌入現代雲端原生應用程式中。 AWS 提供結合無伺服器和 AI 功能的完整服務組合。這些服務包括 Amazon SageMaker Serverless Inference 和 Amazon Bedrock,其可透過全受管的 API 型界面存取基礎模型。Amazon Bedrock AgentCore 將 Amazon Bedrock 延伸到模型以外的完整執行期存取權,以建置、部署和管理自動代理程式。
此外, AWS Lambda 並 AWS Step Functions 啟用開發靈活、符合成本和生產就緒的 AI 系統。與 Amazon Bedrock、SageMaker Serverless Inference 和 AgentCore 等服務搭配使用時,它們提供整合的推理、記憶體和連接器功能,可讓開發人員建立可以跨和外部系統規劃、動作 AWS 服務 和協作的代理程式。這些工具提供 AI 工作負載的強大支援,全都在無伺服器、事件驅動的架構內。
AI 工作負載,特別是推論,通常無法預測且爆量。在傳統架構中,這會導致過度佈建的基礎設施、成本增加和擴展的複雜性。無伺服器模型透過提供下列項目來解決這些問題:
-
彈性可擴展性 – 資源會根據需求自動擴展。
-
成本最佳化 – 閒置運算不收取費用。僅支付執行時間的費用。
-
降低營運開銷 – 較少的操作、較少的管理,以及較少對其他技術、程序或資源的相依性。
-
更快的上市時間 – 開發人員可以專注於商業邏輯和模型效能,而不是管理伺服器。
-
高可用性和內建彈性 – 無 AWS 伺服器方案預設提供這些功能。
這些功能可讓無伺服器自然適應在各種使用案例中部署 AI 模型,從詐騙偵測和個人化建議到文件分析和對話式 AI。
AWS 服務 支援無伺服器 AI
AWS 提供強大的受管服務套件,可協助團隊將智慧嵌入應用程式、協調工作流程,並在不管理基礎設施的情況下對事件做出反應:
-
使用 AWS Lambda,您可以大規模執行事件驅動的運算工作負載,而無需佈建伺服器。它非常適合 AI 預處理和後處理,以及輕量型推論邏輯。
-
使用 Amazon SageMaker Serverless Inference 部署機器學習 (ML) 模型,以使用自動擴展且無閒置費用進行即時預測。
-
Amazon Bedrock 可透過生成式 AI 工作負載的單一 API,從 AI21 Labs
、Anthropic 、Cohere 、DeepSeek 、Luma AI Meta Mistral AI 、、 poolside (即將推出)Writer 、Stability AI 、TwelveLabs 、 和 Amazon 等領導 AI 公司存取基礎模型。 -
使用 Amazon Bedrock Agents,您可以建置 AI 驅動的工作流程,其中模型使用自然語言協調函數呼叫和任務的原因。
-
Amazon Bedrock AgentCore 提供基本執行期、記憶體和連接器功能,可簡化多代理程式系統的建置和擴展。將 AgentCore 整合到無伺服器設計中,可讓開發人員在 上原生建置適應性、內容感知的代理程式, AWS 而無需管理自訂協同運作或狀態處理。
-
Amazon EventBridge 可讓您建置鬆耦合的事件驅動架構,以自動觸發 AI 工作流程。
-
使用 AWS Step Functions 來協調多步驟 AI 管道,並使用 AWS 服務 視覺化工作流程進行連線。
-
使用 AWS IoT Greengrass和 Lambda@Edge,您可以在邊緣部署模型和邏輯,以在 IoT 和全域應用程式中進行低延遲推論。