

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 将模型部署到端点
<a name="canvas-deploy-model"></a>

在 Amazon SageMaker Canvas 中，您可以将模型部署到终端节点以进行预测。 SageMaker AI 为您提供了机器学习基础架构，让您可以将模型托管在带有您选择的计算实例的终端节点上。然后，您可以*调用*端点（发送预测请求）并从模型中获取实时预测。借助此功能，您可以在生产环境中使用模型来响应传入的请求，还可以将模型与现有应用程序和工作流集成。

要开始操作，您应该先拥有想要部署的模型。您可以部署自己构建的自定义模型版本、Amazon SageMaker JumpStart 基础模型和经过微调 JumpStart 的基础模型。有关在 Canvas 中构建模型的更多信息，请参阅[自定义模型的工作原理](canvas-build-model.md)。有关 Canvas 中 JumpStart基础模型的更多信息，请参阅[C SageMaker anvas 中的生成式 AI 基础模型](canvas-fm-chat.md)。

查看以下**权限管理**部分，然后在**部署模型**部分开始创建新部署。

## 权限管理
<a name="canvas-deploy-model-prereqs"></a>

默认情况下，您有权将模型部署到 SageMaker AI Hosting 终端节点。 SageMaker AI 通过策略为所有新的和现有的 Canvas 用户配置文件授予这些权限，该[AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html)策略附加到托管 Canvas 应用程序的 A SageMaker I 域的 AWS IAM 执行角色。

如果您的 Canvas 管理员正在设置新的域或用户配置文件，则当他们设置域并按照中的先决条件说明进行操作时[设置 Amazon C SageMaker anvas 的先决条件](canvas-getting-started.md#canvas-prerequisites)， SageMaker AI 会通过 “**启用直接部署 Canvas 模型” 选项开启模型部署**权限，该选项默认处于启用状态。

Canvas 管理员还可以在用户配置文件级别管理模型部署权限。例如，如果管理员不想在设置域时向所有用户配置文件授予模型部署权限，他们可以在创建域后向特定用户授予权限。

以下过程说明如何修改特定用户配置文件的模型部署权限：

1. 打开 SageMaker AI 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧导航窗格中，选择**管理员配置**。

1. 在**管理员配置**下，选择**域**。

1. 从域列表中，选择用户配置文件的域。

1. 在**域详细信息**页面上，选择**用户配置文件**选项卡。

1. 选择您的**用户配置文件**。

1. 在用户配置文件页面，选择**添加配置**选项卡。

1. 在 **Canvas** 部分中，选择**编辑**。

1. 在 **ML Ops 配置**部分，打开**启用 Canvas 模型的直接部署**开关，以启用部署权限。

1. 选择**提交**以保存对域设置的更改。

用户配置文件现在应该具有模型部署权限。

授予域或用户配置文件权限后，确保用户退出其 Canvas 应用程序并重新登录以应用权限更改。

## 部署模型
<a name="canvas-deploy-model-deploy"></a>

要开始部署模型，您可以在 Canvas 中创建一个新的部署，并指定要部署的模型版本以及 ML 基础设施，例如要用于托管模型的计算实例的类型和数量。

Canvas 会根据您的模型类型建议默认类型和实例数量，或者您可以在 A [mazon SageMaker 定价页面](https://aws.amazon.com/sagemaker/pricing/)上详细了解各种 A SageMaker I 实例类型。您的终端节点处于活动状态时，将根据 SageMaker AI 实例的定价向您收费。

部署 JumpStart 基础模型时，您还可以选择指定部署时间的长度。您可以无限期地将模型部署到端点（这意味着端点一直处于活动状态，直到您删除部署）。或者，如果您只需要在短时间内使用终端节点并希望降低成本，则可以将模型部署到终端节点指定时间，之后 SageMaker AI 会为您关闭终端节点。

**注意**  
如果您要在指定时间内部署模型，请在端点持续期间保持登录 Canvas 应用程序。如果您退出或删除应用程序，则 Canvas 无法在指定时间关闭端点。

将模型部署到 SageMaker AI Host [ing 实时推理终端节点](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html)后，您可以通过*调用*该终端节点开始进行预测。

从 Canvas 应用程序部署模型有几种不同的方法。您可以通过以下任一方法访问模型部署选项：
+ 在 Canvas 应用程序的**我的模型**页面上，选择要部署的模型。然后，在模型的**版本**页面中，选择模型版本旁边的**更多选项**图标 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然后选择**部署**。
+ 在模型版本的详细信息页面的**分析**选项卡上，可以选择**部署**选项。
+ 在模型版本的详细信息页面的**预测**选项卡上，选择页面顶部的**更多选项**图标 (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))，然后选择**部署**。
+ 在 Canvas 应用程序的 **ML Ops** 页面上，选择**部署**选项卡，然后选择**创建部署**。
+ 对于 JumpStart 基础模型和经过微调的基础模型，请转到 Canvas 应用程序的**Ready-to-use 模型**页面。选择**生成、提取和汇总内容**。然后，找到要部署 JumpStart 的基础模型或经过微调的基础模型。选择模型，然后在模型的聊天页面上选择**部署**按钮。

所有这些方法都会打开**部署模型**侧面板，您可在此指定模型的部署配置。要通过此面板部署模型，请执行以下操作：

1. （可选）如果您从 **ML Ops** 页面创建部署，则可以选定**选择模型和版本**。使用下拉菜单选择要部署的模型和模型版本。

1. 在**部署名称**字段中输入名称。

1. （仅适用于 JumpStart 基础模型和经过微调的基础模型）选择**部署长度**。选择**无限期**，使端点处于活动状态，直到关闭为止；或选择**指定时长**，然后输入您希望端点保持活动状态的时间段。

1. 对于**实例类型**， SageMaker AI 会检测适合您的模型的默认实例类型和编号。不过，您可以更改要用于托管模型的实例类型。
**注意**  
如果您的 AWS 账户上所选实例类型的实例配额已用完，则可以申请增加配额。有关默认配额以及如何申请增加配额的更多信息，请参阅*AWS 通用参考指南*中的 [Amazon SageMaker AI 终端节点和配额](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html)。

1. 对于**实例计数**，您可以设置用于终端节点的活跃实例数量。 SageMaker AI 会检测到适合您的型号的默认数字，但您可以更改此数字。

1. 如果您已准备好部署模型，请选择**部署**。

现在，您的模型应该已部署到端点。