为 AI 工作负载的执行策略建模

任何 AI 架构的核心都是模型执行层，即执行推理、为预测提供支持或生成内容的组件。 AWS 为执行 AI 工作负载提供了两条强大的无服务器就绪路径：

通过了解何时以及如何使用它们 AWS 服务，企业可以针对业务需求和运营效率进行优化。

Amazon Bedrock：基础模型即服务

Amazon Bedrock 的主要功能包括以下内容：

文本生成-摘要、重写、内容创建和问答。
代码生成-自然语言编码。
分类和提取-标记、解析和语义标记。
RAG 工作流程 — 与知识库集成，做出有根据的响应。
代理-支持自主编排和工具使用。
多模态智能 — 通过 Amazon Nova，跨文本、图像和视频理解和生成。
微调和蒸馏支持 — 通过 Amazon Nova Premier，训练特定任务的模型或创建紧凑的学生模型。
分层性能和成本 — 从 Amazon Nova Micro、Nova Lite、Nova Pro 和 Nova Premier 型号中进行选择，以平衡延迟、准确性和价格。

Amazon Bedrock 的运营优势包括以下几点：

Amazon Bedrock 通过以下方式与其他 AWS 服务和功能集成：

Amazon Bedrock 非常适合各种场景，例如：

Amazon SageMaker Serverless Inference 专为训练过自己的模型（例如、XGBoostPyTorchScikit-learn、和）的开发人员和TensorFlow数据科学家而设计。通过使用 SageMaker 无服务器推理，他们可以在可扩展的无服务器环境中部署模型。

与 Amazon Bedrock 不同， SageMaker 无服务器推理使您可以控制模型架构、训练数据和逻辑。

SageMaker 无服务器推理的关键功能包括以下内容：

SageMaker 无服务器推理的操作优势包括以下几点：

SageMaker 无服务器推理通过以下方式与其他 AWS 服务和功能集成：

SageMaker 无服务器推理是各种机器学习应用程序的不错选择：

Amazon Bedrock 和 SageMaker 无服务器推理都为可扩展、生产就绪的人工智能执行提供了无服务器路径。它们共同构成了现代、事件驱动、无服务器 AI 架构的核心执行层。 AWS下表按关键维度对这些服务进行了比较。

维度	Amazon Bedrock	SageMaker 无服务器推理
模型类型	基础模型 (LLMs)	自定义训练的 ML 模型
设置工作	最低限度（没有培训或托管）	需要模型训练和打包
使用案例	生成式、对话式和语义式	预测数据、数值数据和结构化数据
可扩展性	完全无服务器且可自动扩展	完全无服务器且可自动扩展
成本模型	按代币支付	按推理付费
集成	API Gateway、Lambda、亚马逊 Bedrock Agents 和 RAG	Lambda、Step Functions 和管道 CI/CD
需要调整	无（零射门或少射门）	完全控制（超参数和再训练）

选择正确的服务取决于您的 AI 工作负载的性质：

当您需要语义灵活性、目标驱动的工作流程以及基础模型的快速迭代时，请使用 Amazon Bedrock。
当您拥有专有模型、结构化输入或需要完全控制训练和部署时，请使用 SageMaker 无服务器推理。
SageMaker JumpStart 用于从数百种内置算法中进行选择，这些算法以及来自模型中心的预训练模型，包括 TensorFlow Hu PyTorch b Hugging Face、Hub 和MxNet GluonCV。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

编排模型：从基于规则到人工智能原生

接地和检索增强生成