

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 上建置代理式 AI 的無伺服器架構 AWS
<a name="introduction"></a>

*Aaron Sempf，Amazon Web Services*

*2026 年 1 月* ([文件歷史記錄](doc-history.md))

AI 和無伺服器運算的融合正在重塑現代企業架構的前景。為了回應，組織正在努力大規模提供智慧型功能。他們面臨越來越大的壓力，以減少營運開銷、加速創新，以及部署可即時適應使用者行為和系統事件的應用程式。

上的無伺服器 AI AWS 代表智慧、適應性、雲端原生系統的基本轉變。透過正確的策略和工具，組織可以釋放更快的創新週期、降低成本和更大的可擴展性。這種方法將它們定位在新一代企業運算的最前線。 透過結合全受管 AI 服務和事件驅動的無伺服器基礎設施來 AWS 實現此轉移。

本指南概述在 上建置 AI 原生、無伺服器架構的策略和技術基礎 AWS。這些架構可擴展、經濟實惠，能夠提供即時智慧，而無需複雜的基礎設施管理。

## 目標對象
<a name="intended-audience"></a>

本指南適用於尋求在現代雲端原生應用程式中利用 AI 驅動軟體代理程式的架構師、開發人員和技術領導者。

## 目標
<a name="objectives"></a>

本指南可協助您執行以下操作：
+ 了解可用於代理式 AI AWS 解決方案開發的原生服務
+ 使用雲端規模可靠性操作代理式 AI
+ 使 AI 執行與業務成果和成本模型保持一致
+ 建立安全、受管 AI 採用的架構

## 關於此內容系列
<a name="content-series"></a>

本指南是代理式 AI 相關系列的一部分 AWS。如需詳細資訊和檢視此系列中的其他指南，請參閱 AWS 方案指引網站上的 [客服人員 AI](https://aws.amazon.com/prescriptive-guidance/agentic-ai/) 。

## 無伺服器 AI 的商業案例
<a name="business-case"></a>

無伺服器運算為現代 AI 工作負載提供了理想的基礎。AI 應用程式通常需要間歇性、運算密集的推論，尤其是在詐騙偵測、建議引擎、文件摘要和客戶服務自動化等使用案例中。傳統基礎設施模型在管理無法預測或尖峰工作負載時，可能非常昂貴且操作複雜。

相比之下，無伺服器架構具有顯著的優勢。它們會自動擴展、隨需執行、降低營運開銷，以及僅針對使用的資源收取費用。這些功能使無伺服器架構非常適合將 AI 嵌入現代雲端原生應用程式中。 AWS 提供結合無伺服器和 AI 功能的完整服務組合。這些服務包括 Amazon SageMaker Serverless Inference 和 Amazon Bedrock，其可透過全受管的 API 型界面存取基礎模型。Amazon Bedrock AgentCore 將 Amazon Bedrock 延伸到模型以外的完整執行期存取權，以建置、部署和管理自動代理程式。

此外， AWS Lambda 並 AWS Step Functions 啟用開發靈活、符合成本和生產就緒的 AI 系統。與 Amazon Bedrock、SageMaker Serverless Inference 和 AgentCore 等服務搭配使用時，它們提供整合的推理、記憶體和連接器功能，可讓開發人員建立可以跨和外部系統規劃、動作 AWS 服務 和協作的代理程式。這些工具提供 AI 工作負載的強大支援，全都在無伺服器、事件驅動的架構內。

AI 工作負載，特別是推論，通常無法預測且爆量。在傳統架構中，這會導致過度佈建的基礎設施、成本增加和擴展的複雜性。無伺服器模型透過提供下列項目來解決這些問題：
+ **彈性可擴展**性 – 資源會根據需求自動擴展。
+ **成本最佳化** – 閒置運算不收取費用。僅支付執行時間的費用。
+ **降低營運開銷** – 較少的操作、較少的管理，以及較少對其他技術、程序或資源的相依性。
+ **更快的上市時間** – 開發人員可以專注於商業邏輯和模型效能，而不是管理伺服器。
+ **高可用性和內建彈性** – 無 AWS 伺服器方案預設提供這些功能。

這些功能可讓無伺服器自然適應在各種使用案例中部署 AI 模型，從詐騙偵測和個人化建議到文件分析和對話式 AI。

## AWS 服務 支援無伺服器 AI
<a name="aws-services-powering"></a>

AWS 提供強大的受管服務套件，可協助團隊將智慧嵌入應用程式、協調工作流程，並在不管理基礎設施的情況下對事件做出反應：
+ 使用 [AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/welcome.html)，您可以大規模執行事件驅動的運算工作負載，而無需佈建伺服器。它非常適合 AI 預處理和後處理，以及輕量型推論邏輯。
+ 使用 [Amazon SageMaker Serverless Inference](https://docs.aws.amazon.com/sagemaker/latest/dg/serverless-endpoints.html) 部署機器學習 (ML) 模型，以使用自動擴展且無閒置費用進行即時預測。
+ [Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html) 可透過生成式 AI 工作負載的單一 API，從 [https://aws.amazon.com/bedrock/ai21/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/ai21/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77)、[https://aws.amazon.com/bedrock/anthropic/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D](https://aws.amazon.com/bedrock/anthropic/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D)、[https://aws.amazon.com/bedrock/cohere/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D](https://aws.amazon.com/bedrock/cohere/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D)、[https://aws.amazon.com/bedrock/deepseek/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/deepseek/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77)、[https://aws.amazon.com/bedrock/luma-ai/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/luma-ai/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77)[https://aws.amazon.com/bedrock/meta/](https://aws.amazon.com/bedrock/meta/)[https://aws.amazon.com/bedrock/mistral/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/mistral/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77)、、 [https://aws.amazon.com/bedrock/poolside/](https://aws.amazon.com/bedrock/poolside/)（即將推出）[https://aws.amazon.com/bedrock/writer/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/writer/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77)、[Stability AI](https://aws.amazon.com/bedrock/stability-ai/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77)、[https://aws.amazon.com/bedrock/twelvelabs/](https://aws.amazon.com/bedrock/twelvelabs/)、 和 [Amazon](https://aws.amazon.com/ai/generative-ai/nova/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77) 等領導 AI 公司存取基礎模型。
+ 使用 [Amazon Bedrock Agents](https://docs.aws.amazon.com/bedrock/latest/userguide/agents.html)，您可以建置 AI 驅動的工作流程，其中模型使用自然語言協調函數呼叫和任務的原因。
+ [Amazon Bedrock AgentCore](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/what-is-bedrock-agentcore.html) 提供基本執行期、記憶體和連接器功能，可簡化多代理程式系統的建置和擴展。將 AgentCore 整合到無伺服器設計中，可讓開發人員在 上原生建置適應性、內容感知的代理程式， AWS 而無需管理自訂協同運作或狀態處理。
+ [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) 可讓您建置鬆耦合的事件驅動架構，以自動觸發 AI 工作流程。
+ 使用 [AWS Step Functions](https://docs.aws.amazon.com/step-functions/latest/dg/welcome.html) 來協調多步驟 AI 管道，並使用 AWS 服務 視覺化工作流程進行連線。
+ 使用 [AWS IoT Greengrass](https://docs.aws.amazon.com/greengrass/v2/developerguide/what-is-iot-greengrass.html)和 [Lambda@Edge](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/lambda-at-the-edge.html)，您可以在邊緣部署模型和邏輯，以在 IoT 和全域應用程式中進行低延遲推論。