模式 1：无服务器 ML 推理管道

在许多企业环境中，团队需要将 AI 注入运营工作流程，例如，对用户反馈进行分类、检测传入遥测中的异常情况或对风险进行实时评分。这些由机器学习 (ML) 驱动的功能通常嵌入在面向客户的应用程序、移动应用程序或内部自动化系统中。

但是，传统的 ML 推理工作负载通常需要以下内容：

这些要求会产生以下结果：

此外，工程团队通常缺乏专业的机器学习基础架构技能来维持这种复杂性，人工智能的采用在原型阶段停滞不前。

无服务器机器学习推理模式：轻量级、事件驱动、可扩展

无服务器机器学习推理管道模式使用完全托管的事件驱动 AWS 服务来消除基础架构负担。这种方法使推理工作流程能够仅在需要时触发和运行，并根据需求自动扩展。

这种模式非常适合执行以下任务：

参考架构按如下方式实现每个层：

事件触发器 — 使用 Amazon API Gateway 处理用户请求，使用亚马逊 EventBridge处理商业活动，使用 Amazon S3 处理数据上传。
处理层-AWS Lambda用于标准化输入、验证架构和丰富元数据的工具。
推理层-部署SageMaker 无服务器推理端点以执行分类、回归或评分。
后处理-使用 Lambda 格式化响应、存储日志和发出新事件。
输出-实现 API Gateway 以将结果返回给用户或将事件发布到以 EventBridge 进行下游处理。

通过使用 AWS Cloud Development Kit (AWS CDK) 或 ()、版本化和可观察，整个管道可以部署为基础设施即代码 AWS Serverless Application Model (IaC AWS SAM)。

一家全球电子商务公司希望对产品评论或支持票证上留下的客户反馈进行分类，以尽早发现批评者并确定后续行动的优先顺序。分类系统必须满足以下要求：

对于此用例，无服务器推理管道解决方案包括以下步骤：

无服务器 ML 推理管道在以下领域提供了价值：

无服务器机器学习推理管道是许多希望以渐进和务实的方式采用 AI 的组织的切入点。这是实现以下目标的理想模式：

通过抽象化基础架构，团队可以专注于业务逻辑、模型准确性和提供真正的价值，而不会牺牲运营控制或可扩展性。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

设计无服务器 AI 架构

模式 2：使用 Amazon Bedrock 进行代理人工智能编排