边缘 AI 和全球推理分布

尽管基于云的推理适用于大多数企业用例，但某些场景需要实时响应、离线功能或靠近数据源或用户。对于这些情况，边缘 AI 在设备上或设备附近执行 AI 逻辑，为无服务器云架构提供了强大的补充。

AWS 通过两种关键的无服务器技术支持边缘 AI：

Lambda @Edge 使用亚马逊在 AWS 边缘站点全局运行推理逻辑。 CloudFront

示例-一家全球电子商务网站使用 Lambda @Edge 函数，根据用户的位置和语言对主页内容进行个性化设置。因此，它可以从最近的 CloudFront 边缘位置立即提供量身定制的体验。

AWS IoT Greengrass允许在连接的设备上执行本地 AI。

示例 — 智能设备使用部署的模型 AWS IoT Greengrass 进行实时诊断，在需要时或连接允许时将见解同步到云端。

这些技术共同将无服务器 AI 的覆盖范围扩展到低延迟、带宽敏感或离线环境以及全球分布的用户群。

Lambda @Edge：CDN 层的全局推理

通过使用 Lambda @Edge，开发人员可以在 CloudFront 边缘位置运行 AWS Lambda 函数。这种方法可以减少最终用户的延迟，并实现情境感知和超快的 AI 体验。

Lambda @Edge 的主要功能包括以下内容：

Lambda @Edge 支持以下关键用例：

通过将推理逻辑尽可能靠近用户，Lambda @Edge 支持高度个性化、人工智能驱动的前端交付，非常适合大规模消费类应用程序。

Lambda @Edge 通常与 Amazon Bedrock 或 SageMaker Serverless Inference 配合使用，使用异步路由和缓存策略将速度与智能相结合。

AWS IoT Greengrass 是一个轻量级运行时，客户可以使用它来运行 Lambda 函数、机器学习推理和自定义代码。它可在工业控制器、相机、医疗设备或智能家电等边缘设备上运行。

的关键功能 AWS IoT Greengrass 包括以下内容：

AWS IoT Greengrass 支持跨多个行业的边缘推理应用程序，例如：

AWS IoT Greengrass 使这些工作负载能够快速、有弹性且不受云延迟的影响，同时还能提供云端管理、可观察性和同步性。通过使用 AWS IoT Greengrass，开发人员可以部署云中使用的相同的 Lambda 函数，从而在集中式和分布式系统之间实现连续性。

企业可以结合使用 Lambda @Edge 和 AWS IoT Greengrass 来创建分层边缘人工智能系统。这种混合架构可以根据延迟敏感度、模型大小、连接性和合规性要求，在正确的层面做出明智的决策。下表描述了此架构中的等级、 AWS 技术和角色。

Tier	AWS 科技	技术角色
设备边缘	AWS IoT Greengrass	在设备上支持离线使用人工智能逻辑传感器数据处理
网络边缘	Lambda@Edge	内容个性化用户附近的轻量级 AI 超低延迟
云核心	Amazon Bedrock、Amazon SageMaker 无服务器推理和 AWS Step Functions	繁重的 AI 推理编排代理推理 RAG 管道

边缘人工智能是无服务器架构的自然演变，它带来了低延迟推理、情境个性化以及应对连接挑战的弹性。借助 AWS IoT Greengrass 和 Lambda @Edge，组织可以实现以下目标：

从智慧城市到野外机器人再到全球媒体交付，人工智能正变得无处不在。为了支持这种演变，它们 AWS 服务可以在构建可在任何地方运行的分布式智能应用程序方面发挥基础作用。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

接地和检索增强生成

设计无服务器 AI 架构