View a markdown version of this page

步骤 3:使用部署仪表板向导部署用例 - AWS 上的生成式人工智能应用程序构建者

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 3:使用部署仪表板向导部署用例

在部署仪表板向导中,您必须在以下选项之间进行选择:

显示五个选项:创建文本用例、创建 Bedrock Agent 用例、创建 MCP 服务器用例、创建 Agent Builder 用例或创建工作流程用例。

部署用例

步骤 3a:部署文本用例

本节提供部署文本用例的说明。

选择用例

选择 “创建文本” 用例后,用户界面将打开 “选择用例” 屏幕。提供以下信息:

  • 用例名称。

  • 将该用例的默认用户添加到该用例的 Amazon Cognito 用户池并获得与其交互的权限的可选电子邮件地址。

  • 是否要使用此用例部署 UI。如果您不想使用该用例部署 UI,则可以使用已部署的 API 端点与您的应用程序一起使用。

使用案例详细信息

用例详细信息步骤允许您为部署配置其他设置。

默认情况下,当解决方案部署部署控制面板时,文本用例会为您创建和配置 Amazon Cognito 用户池。该解决方案使用同一用户池中新创建的客户端对新的用例进行身份验证。但是,如果您想在用例中使用自己的 Amazon Cognito 用户池和客户端,则可以在此步骤中提供现有的用户池 ID 和客户端 ID。

重要

通过部署向导创建 Amazon Cognito 用户池后,管理员用户可以访问所有已部署的用例。如果您在部署期间提供了自己的用户池,则必须确保管理员有权访问已部署的用例。

您还需要在 Cognito 中更新应用程序客户端 URLs 中允许的回调 URLs 和允许的注销。要实现此目的,应按照以下步骤进行:

  1. 导航到 Cognito 控制台

  2. 选择用户池

  3. 选择您的用户池。

  4. 在左侧菜单中选择 “应用程序客户端”。

  5. 选择要修改的应用程序客户端。

  6. 选择 “登录页面” 选项卡。

  7. 选择编辑并添加您的 URLs.

  8. 选择保存更改

此外,如果您需要在用例中添加更多用户,请参阅管理 Cognito 用户池部分

选择网络配置

此向导步骤允许您使用预先存在的或新的亚马逊虚拟私有云(Amazon VPC)部署用例。如果选择预先存在的 VPC,则需要提供一个 VPC ID、最多 16 个子网 ID 和最多 5 个安全组 IDs 才能与此 VPC 一起使用。如果您没有使用预先存在的 VPC,则将为您配置这些设置。

选择模型

选择模型步骤中,您可以从下拉菜单中选择您的模型提供商。有两种选择:基岩和。SageMaker

如果选择 SageMaker,则可以在 SageMaker AI 控制台中创建 A SageMaker I 模型终端节点,并提供模型期望的输入架构和 LLM 响应 JSONPath 的输出。您可以参考解决方案 GitHub 存储库中提供的 “使用 SageMaker Amazon AI 作为 LLM 提供商” 部分和 SageMaker AI 负载示例

如果您选择 Amazon Bedrock,您将看到四个选项:

  • 快速入门模型-使用一系列具有不同 price/performance 特征的模型快速入门。推荐用于构建您的第一个应用程序。此选项允许您从提供的列表中选择型号名称。

  • 其他基础模型-访问具有不同功能和专业的全系列基础模型。此选项允许您输入所需的 Bedrock 按需基础模型的模型 ID。

  • 推理配置文件-推理配置文件利用 Bedrock 的跨区域推理,在利用率高峰期将请求路由到多个 AWS 区域,从而提高吞吐量并提高弹性。此选项允许您输入要使用的推理配置文件的 ID。

  • 预配置模型-为需要一致性能的生产工作负载提供专用吞吐容量。此选项允许您输入要从 Amazon Bedrock 使用的 provisioned/custom 模型的 ARN。

模型选择步骤还允许您选择高级模型设置。有关配置 Amazon Bedrock Guardrails、Amazon Bedrock 的预配置吞吐量以及其他模型参数的详细信息,请参阅高级 LLM 设置

跨区域推理

跨区域推理可帮助 Amazon Bedrock 用户通过使用跨不同 AWS 区域的计算来无缝管理计划外的流量爆发。要使用跨区域推理,您需要推理配置文件。推理配置文件是对一组已配置的 AWS 区域中的按需资源池的抽象。它可以将来自您的源区域的推理请求路由到该池中配置的另一个区域。这允许在多个 AWS 区域之间分配流量。这有助于在需求高峰期实现更高的吞吐量和增强的弹性。

推理配置文件以其支持的模型和区域命名。您必须从推理配置文件包含的其中一个区域调用推理配置文件。例如,如下表所示,推理配置文件 ID us.anthropic.claude-3-haiku-20240307-v1:0 允许在您选择的模型us-east-1us-west-2区域上分配流量。某些模型仅在特定区域具有推理配置文件时才可用。

推理配置文件 推理配置文件 ID 包括的区域

US Anthropic Claude 3 Haiku

us.anthropic.claude-3-haiku-20240307-v1:0

美国东部(弗吉尼亚州北部)(us-east-1)

美国西部(俄勒冈州)(us-west-2)

如果要使用推理配置文件 ID 而不是模型 ID,则必须标识相应的推理配置文件 ID。有关更多信息,请参阅 Amazon Bedrock 用户指南中的推理配置文件支持的区域和模型。在 Amazon Bedrock 控制台中,左侧导航菜单中的跨区域推理选项提供了这些推理配置文件。 IDs

确定要使用的推理配置文件 ID 后,您可以通过执行以下步骤在 “选择模型” 阶段使用它:

  1. 选择 Amazon Bedrock 作为模型提供商。

  2. 选择 “推理配置文件” 单选按钮选项。

  3. 在出现的文本框中输入您的推理配置文件 ID。

有关推理配置文件的更多详细信息,请参阅 A mazon Bedrock 用户指南中的通过跨区域推理提高弹性

选择知识库

如果您想部署非检索增强生成 (RAG) 用例,则可以跳过此步骤。

但是,如果您希望在部署过程中启用 RAG,则现在可以提供预配置的 Amazon Kendra 索引 ID 或亚马逊 Bed rock 知识库 ID。您也可以创建新的 Amazon Kendra 索引以用于该解决方案。该解决方案目前支持 Amazon Kendra 和 Amazon Bedrock 知识库作为基于 RAG 的用例部署的知识库。

有关将数据提取到知识库以用于基于 RAG 的部署的指南,请参阅配置知识库部分。

高级 RAG 配置

该向导允许您选择用于RAG部署的高级选项,例如每次向知识库发送查询时要检索的文档数量,在知识库中找不到文档时LLM的静态文本响应,是否希望在LLM响应中显示文档源以进行健全性检查等。此外,您还可以为 Amazon Kendra 配置知识库的特定配置,例如基于角色的访问控制 (RBAC),或者在使用 Amazon Serverless OpenSearch 和 Amazon B edrock 知识库时覆盖搜索类型。有关这些高级设置的更多详细信息,请参阅高级知识库设置部分。

注意

您的知识库必须与部署的部署控制面板和用例堆栈位于相同的账户和区域。

选择提示和令牌限制

在此步骤中,您可以配置与 LLM 一起使用的提示。提示可能需要占位符{input},例如、{history}和。{context}这些占位符指示 LLM 在哪里提取用户输入、对话历史记录以及从知识库中检索到的信息。

  • 对于 Bedrock 模型提供商,必须提供系统提示,该提示符对非 RAG 用例没有限制。但是,Bedrock 模型提供者的消除歧义提示至少需要两个占位符——而且 {input} {history}

  • 对于 SageMaker 模型提供者、系统和歧义消除提示,两者都需要至少两个占位符——和。{input} {history}

  • 对于 RAG 用例,对于每个模型提供者,还需要{context}占位符。

有关更多信息,请参阅配置提示。您也可以参阅 “管理模型代币限制的提示” 部分,同时为提示选择代币限制大小。

启用多模态输入

此步骤允许您为用例启用多模式输入功能。启用后,用户可以上传和发送图像和文档以及文本查询。

支持的文件类型和限制:

  • 图片:每封邮件最多 20 张图片。每张图片的大小不得超过 3.75 MB,高度和宽度不得超过 8,000 像素。支持的格式:png、jpeg、gif、webp

  • 文档:每封邮件最多 5 个文档。每个文档的大小不得超过 4.5 MB。支持的格式:pdf、csv、doc、docx、xls、xlsx、html、txt、md

如何使用多模态输入:

  1. 在用例部署期间启用该MultimodalEnabled参数

  2. 在聊天界面中,用户可以通过两种方式上传文件:

    • 点击聊天输入框中的上传按钮,或

    • 将文件直接拖放到聊天界面中

  3. 文件上传到 Amazon S3 并由所选模型进行处理

  4. 上传的文件将在 48 小时后自动删除

文件状态跟踪:

DevOps 用户可以监控 DynamoDB 中的文件元数据,包括上传时间和处理状态。文件可以具有以下状态:

  • 待处理-文件上传已开始但尚未完成。这是生成预签名 URL 时的初始状态。

  • 已@@ 上传-文件已成功上传到 S3,可供模型处理。

  • d eleted-文件已被用户删除,不应再访问该文件进行处理。

  • in valid-文件未通过验证检查(例如,文件类型不匹配或安全验证失败)。

处于待处理状态且从未上传的文件将在其 TTL 到期时自动清除。模型只能处理状态为已上传的文件。

部署控制面板输出中提供了 S3 多模式存储桶和 DynamoDB 元数据表,其中分别包含密钥和。MultimodalDataBucketName MultimodalDataMetadataTable

注意

并非所有型号都支持多模态输入。启用此功能之前,请确保所选型号支持图像和文档处理。请参阅 Amazon Bedrock 文档中的支持基础模型,以查看哪种型号支持图像作为输入模式。

重要

用户上传的文件按照 48 小时生命周期策略存储在 Amazon S3 中。有关已上传文件的元数据存储在 Amazon DynamoDB 中,对话历史记录的 TTL 为 24 小时。

查看并部署

完成此步骤后,查看您选择的设置并选择 “部署用例”。然后,新的用例将部署并显示在您的部署仪表板视图中,以便进一步管理。

步骤 3b:部署 Bedrock Agent 用例

Bedrock Agent 用例提供了一种强大而安全的机制,用于在您的用例中调用 Amazon Bedrock Agent。该功能允许开发人员无缝集成人工智能驱动的自治代理的功能,这些代理可以在各种基础模型、数据源、软件应用程序和用户对话中协调和执行多步骤任务,同时保持强大的安全措施。

先决条件

在创建 Amazon Bedrock 代理之前,请确保您具备以下条件:

  1. 在 AWS 上部署生成式 AI 应用程序生成器的 AWS 账户,可以访问 Amazon Bedrock 控制台。

  2. 创建和管理 Amazon Bedrock 代理的适当 IAM 权限。

创建 Amazon 基岩代理

有关创建代理的详细说明,请参阅 Amazon Bedrock 用户指南中的手动创建和配置代理。您可以配置选项,例如:

  • 给您的代理的说明(提示)

  • 知识库,用于根据用户的输入查找其他信息

  • 代理的内存,允许代理在多个会话中记住信息(最长 30 天)

成功创建 Amazon Bedrock 代理后,您可以继续前往 AWS Bedrock Agent 上的生成式 AI 应用程序生成器用例向导流程。为此,请在 “部署” 仪表板上选择 “部署新用例”,然后选择 “创建 Bedrock Agent 用例”。按照向导并使用以下步骤配置用例。

选择用例

此步骤与前面描述的文本用例相同。

选择网络配置

此步骤与前面描述的 “文本” 用例相同

选择代理

在此步骤中,您必须提供您创建的 Amazon Bedrock 代理的代理 ID 和别名 ID

步骤 3c:部署 MCP 服务器用例

MCP(模型上下文协议)服务器用例使您能够部署和管理可与 AI 模型和代理集成的 MCP 服务器。MCP 服务器提供了一种向 AI 应用程序公开工具、资源和功能的标准化方式。您可以利用现有 Lambda 函数创建 MCP 服务器,也可以使用容器 APIs映像托管自定义 MCP 服务器。

先决条件

在部署 MCP 服务器用例之前,请确保具备以下条件:

  1. 在 AWS 上部署生成式 AI 应用程序生成器的 AWS 账户。

  2. 创建和管理 Amazon Bedrock AgentCore 资源的适当 IAM 权限。

  3. 根据您选择的创建方法:

    • 对于网关方法(Lambda/API/MCP服务器):Lambda 函数、API 终端节点及其相应的架构文件(Lambda 的 JSON 格式 APIs)或 MCP 服务器 OpenAPI/Smithy URL 终端节点

    • 对于运行时方法 (ECR):推送到亚马逊 ECR 的 Docker 容器镜像,其中包含你的 MCP 服务器实现

MCP 服务器的创建方法

该解决方案支持两种创建 MCP 服务器的方法:

从 Lambda、API 或 MCP 服务器创建(网关方法)

此方法创建一个 MCP 网关,该网关封装了现有 Lambda 函数 APIs、REST 或外部 MCP 服务器,使它们可以作为 MCP 工具进行访问。网关处理 MCP 和现有服务之间的协议转换。

  • Lambda 目标:通过提供函数 ARN 和描述函数格式的 JSON 架构文件来整合现有的 Lambda 函数 input/output

  • OpenAPI 目标:使用 O APIs penAPI 规范(JSON 或 YAML 格式)集成 REST,支持 2.0 或 API 密钥身份验证 OAuth

  • Smithy 目标:使用 Smithy 模型文件(.smithy 或.json 格式)进行集成 APIs

  • MCP 服务器目标:通过 URL 端点直接连接到外部 MCP 服务器,无需部署新基础架构即可集成现有 MCP 服务器

您可以在单个 MCP 网关中配置多个目标(最多 10 个),每个目标代表不同的工具或功能。

从 ECR 映像托管(运行时方法)

此方法通过 Amazon ECR 映像部署容器化 MCP 服务器。当您的自定义 MCP 服务器实现需要作为独立服务运行时,请使用此方法。

  • 提供 ECR 映像 URI(必须包含标签,例如:latest:v1.0.0

  • (可选)配置环境变量以将配置传递给您的容器

  • 容器必须实现 MCP 协议并公开所需的端点

部署 MCP 服务器

要部署 MCP 服务器用例,请在 “部署” 仪表板上选择 “部署新用例”,然后选择 “创建 MCP 服务器用例”。按照向导并使用以下步骤配置用例。

选择用例

此步骤与前面描述的文本用例相同。

选择网络配置

当前,仅启用公共访问,不支持 VPC 进行网络配置。

创建 MCP 服务器

在此步骤中,您将配置 MCP 服务器部署:

MCP 服务器的创建方法

在两种创建方法之间进行选择:

  • 从 Lambda、API 或 MCP 服务器创建:利用现有 Lambda 函数、API 规范或外部 MCP 服务器终端节点创建 MCP 网关

  • 从 ECR 镜像托管:从容器映像部署自定义 MCP 服务器

注意

部署后无法更改创建方法。如果需要切换方法,则必须部署新的 MCP 服务器用例。

网关配置(适用于Lambda/API/MCP服务器方法)

如果您选择了网关方法,请配置一个或多个目标:

  1. 目标名称(必填):用于标识此目标配置的友好名称

  2. 目标描述(可选):对该目标的作用进行简要描述

  3. 目标类型:选择要配置的目标类型:

    • Lambda:适用于 AWS Lambda 函数

    • OpenAPI:适用于带有 Op APIs enAPI 规范的 REST

    • Smithy:For with S APIs mithy 模型定义

    • MCP 服务器:用于通过 URL 端点直接连接到外部 MCP 服务器

  4. 架构文件(必填):上传描述目标的架构文件:

    • 对于 Lambda:描述 input/output 格式的 JSON 架构文件。有关创建 Lambda 工具架构的详细信息,请参阅 Amazon Bedrock 开发者指南中的 Lambda 工具架构。 AgentCore

    • 对于 OpenAPI:OpenAPI 规范文件(JSON 或 YAML)。有关 OpenAPI 架构要求的详细信息,请参阅《亚马逊 Bedrock 开发者指南》中的 OpenAPI 架构。 AgentCore

    • 对于 Smithy:Smithy 模型文件(.smithy 或.json)。有关构建 Smithy 目标的详细信息,请参阅 A mazon Bedrock AgentCore 开发者指南中的构建 Smithy 目标

  5. Lambda 函数 ARN(Lambda 目标所必需的):要集成的 Lambda 函数的 ARN

  6. MCP 服务器 URL(MCP 服务器目标所必需的):要连接的外部 MCP 服务器的 URL 端点。网址必须经过正确编码,MCP 服务器必须支持 MCP 协议版本为 2025-06-18 的工具功能。有关更多信息,请参阅 Amazon Bedrock AgentCore 开发者指南中的 MCP 服务器目标

  7. 出站身份验证(OpenAPI 目标需要进行身份验证):为 REST API 调用配置身份验证:

    • 身份验证类型:选择 OAuth 2.0 或 API 密钥

    • 出站身份验证提供商 ARN:亚马逊 Bedrock 令牌库中凭证提供商的 ARN AgentCore

    • 其他配置:视身份验证类型而定:

      • 对于 OAuth 2.0:配置作用域和自定义参数

      • 对于 API 密钥:指定位置(标题或查询参数)、参数名称和可选前缀

您可以通过选择添加其他目标来添加多个目标(最多 10 )。每个目标代表您的 MCP 服务器公开的单独工具或功能。

ECR 配置(用于 ECR 映像方法)

如果您选择了运行时方法,请提供:

  1. ECR 镜像 URI(必填):亚马逊 ECR 中 Docker 镜像的完整 URI

    • 格式:account-id.dkr.ecr.region.amazonaws.com/repository-name:tag

    • 映像必须与您的部署位于同一 AWS 区域

    • 需要一个标签(例如:latest:v1.0.0

  2. 环境变量(可选):配置键值对以在运行时传递到容器

    • 使用它们来提供配置、凭证或自定义标志

    • 您最多可以添加 10 个环境变量

查看并部署

配置 MCP 服务器后,查看所选设置并选择 “部署用例”。然后,新的 MCP Server 用例将部署并显示在您的部署仪表板视图中,以便进一步管理。

注意

MCP 服务器部署在 Amazon Bedrock 中创建资源 AgentCore,包括网关、运行时和工作负载身份。这些资源由解决方案自动管理,当您删除用例时,这些资源将被清除。

步骤 3d:部署代理生成器用例

代理生成器使您能够在 Amazon Bedrock 上创建、配置和部署可用于生产的 AI 代理。 AgentCore此功能可通过系统提示、型号选择、MCP 服务器集成和内存管理来完全控制代理行为。

部署过程与文本用例基本相同,但有一些明显的区别。

选择用例

此步骤与前面描述的文本用例相同。

使用案例详细信息

此步骤与前面描述的文本用例相同。

配置代理

在此步骤中,您将配置核心代理设置,包括系统提示符、可用的 MCP servers/Strands 工具和内存。

系统提示符

系统提示符定义了代理的行为、个性和能力。你可以:

  • 编辑默认系统提示模板

  • 使用 “重置为默认值” 按钮恢复原始模板

  • 包括工具使用说明和响应格式说明

MCP 服务器集成(可选)

配置模型上下文协议服务器,让您的代理能够访问企业工具和数据:

  1. 在下拉列表中从可用的 MCP 服务器中进行选择

  2. 查看代理可以访问的开箱即用工具

注意

在部署之前,必须对 MCP 服务器进行配置和访问。有关服务器设置说明,请参阅 MCP 文档。

内存配置

配置代理如何维护上下文和知识:

  • 短期内存:默认情况下,所有代理都处于启用状态。维护会话中的对话背景。

  • 长期记忆:切换以启用跨会话提取和存储见解。使用带有语义 AgentCore 记忆策略的内存。

查看并部署

完成此步骤后,查看您选择的设置并选择 “部署用例”。代理生成器部署通常会在 10-15 分钟内完成。然后,新的用例将显示在您的部署仪表板视图中,以便进一步管理。

步骤 3e:部署工作流程用例

通过 Workflow Builder,您可以使用 “代理即工具” 委派模式创建主管代理,以协调多个代理生成器代理。此功能允许您通过重复使用现有的 Agent Builder 部署来构建复杂的多代理工作流。

部署过程遵循与 Agent Builder 类似的模式,包括代理发现和选择的其他步骤。

选择用例

此步骤与前面描述的文本用例相同。

使用案例详细信息

此步骤与前面描述的文本用例相同。

配置主管代理

在此步骤中,您将配置将协调专门的 Agent Builder 代理的 Supervisor 代理。

系统提示符

系统提示符定义主管代理如何将工作委托给专业代理。你可以:

  • 编辑默认系统提示模板

  • 包括代理选择和委派说明

  • 定义如何汇总来自多个代理的结果

  • 使用 “重置为默认值” 按钮恢复原始模板

注意

系统提示应清楚地描述何时以及如何使用每个专业代理。代理描述对于正确委派至关重要。

模型选择

为主管代理选择基础模型。主管代理使用此模型来:

  • 了解用户请求

  • 选择合适的专业代理

  • 协调代理执行

  • 汇总和格式化回复

选择专业代理

在此步骤中,您可以选择主管可以将工作委托给哪些 Agent Builder 代理。

添加代理

  1. 单击 “添加代理” 打开代理选择对话框

  2. 从列表中选择一个或多个 Agent Builder 代理

  3. 查看将提供给主管的代理描述

  4. 确认选择

注意
  • 作为专业代理,工作流至少需要 1 个 Agent Builder 用例

  • 在创建工作流之前,必须成功部署所有专业代理

查看并部署

查看工作流程配置,包括:

  • 主管代理系统提示和型号

  • 专业代理商名单

  • 内存设置

选择 “部署用例”。工作流程部署通常会在 15-20 分钟内完成。新的工作流程将显示在您的部署仪表板视图中,以便进一步管理。