

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用控制台配置模型自动扩缩
<a name="endpoint-auto-scaling-add-console"></a>

**要为模型（管理控制台）配置自动扩缩功能**

1. 打开 Amazon A SageMaker I 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

1. 在导航窗格中选择**推理**，然后选择**端点**。

1. 选择端点，然后在**端点运行时设置**中选择变体。

1. 选择 **Configure auto scaling** (配置自动扩展)。

1. 在**配置变量自动扩缩**页面的**变量自动扩缩**中，执行以下操作：

   1. 在**最小实例数**中，键入希望扩展策略保持的最小实例数。至少需要 1 个实例。

   1. 在**最大实例数**中，键入希望扩展策略保持的最大实例数。

1. 对于**Built-in 扩展策略**，请执行以下操作：

   1. 对于**目标指标**，`SageMakerVariantInvocationsPerInstance` 会被自动选择为指标，且无法更改。

   1. 对于**目标值**，请键入模型每分钟每个实例的平均调用次数。要确定该值，请按照[负载测试](endpoint-scaling-loadtest.md)中的准则进行操作。

   1. （可选）对于**Scale-in 冷却（秒）**和**Scale-out 冷却（秒）**，请输入每个冷却时间段的时间（以秒为单位）。

   1. (可选）如果不想在流量减少时自动扩缩终止实例，请选择**禁用横向缩减**。

1. 选择**保存**。

此过程使用 Application Auto Scaling 将模型注册为可扩展目标。当您注册模型时，Application Auto Scaling 执行验证检查以确保以下内容：
+ 该模型存在
+ 权限足够
+ 您没有注册具有可突增性能实例 (如 T2) 的变体。
**注意**  
SageMaker AI 不支持 T2 等可突发实例的 auto Scaling，因为它们已经允许在工作负载增加的情况下增加容量。有关可突增性能实例的信息，请参阅 [Amazon EC2 实例类型](https://aws.amazon.com/ec2/instance-types/)。