

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 管理 Amazon Comprehend 终端节点
<a name="manage-endpoints"></a>

在 Amazon Comprehend 中，终端节点使您的自定义模型可用于实时分类或实体检测。在创建终端节点之后，您可以根据业务需求的变化对其进行修改。例如，您可以监控终端节点利用率并应用自动扩缩来自动设置终端节点配置以满足您的容量需求。您可以从单一视图管理所有终端节点，当您不再需要某个终端节点时，可以将其删除以节省成本。

必须先创建终端节点，然后才能管理终端节点。有关更多信息，请参阅以下流程：
+ [为自定义分类创建终端节点](custom-sync.md#create-endpoint)
+ [为自定义实体检测创建终端节点](detecting-cer-real-time.md#detecting-cer-real-time-create-endpoint)

**Topics**
+ [

# Amazon Comprehend 终端节点概览
](manage-endpoints-overview.md)
+ [

# 使用 Amazon Comprehend 终端节点
](using-endpoints.md)
+ [

# 正在监控 Amazon Comprehend 终端节点
](manage-endpoints-monitor.md)
+ [

# 正在更新 Amazon Comprehend 终端节点
](manage-endpoints-update.md)
+ [

# 在亚马逊 Compreh Trusted Advisor end 上使用 Amazon Comprehend
](manage-endpoints-trusted-advisor.md)
+ [

# 正在删除 Amazon Comprehend 终端节点
](manage-endpoints-delete.md)
+ [

# 使用终端节点自动扩缩
](comprehend-autoscaling.md)

# Amazon Comprehend 终端节点概览
<a name="manage-endpoints-overview"></a>

Amazon Comprehend 控制台中的终端节点页面为您提供了终端节点的全局视图。在终端节点概述页面上，您可以在一个地方查看所有终端节点，以了解您的终端节点使用情况与实际资源使用情况。在终端节点页面的右上角，您可以指定要查看的终端节点，包括所有终端节点、自定义分类器终端节点或您的自定义实体终端节点。

您可以在此页面创建、更新、监控和删除终端节点。在终端节点概述部分中，您可以查看终端节点列表、终端节点托管的自定义模型、它们的创建时间、预配置的吞吐量以及终端节点的状态。当您从终端节点概述表中选择特定终端节点时，将显示终端节点的详细信息。

此外，如果您是 [AWS 商业支持](https://aws.amazon.com/premiumsupport/plans/business/)或 [AWS 企业支持](https://aws.amazon.com/premiumsupport/plans/enterprise/)客户，则可以访问特定于您的终端节点的 Trusted Advisor 检查。要了解更多信息，请参阅[在亚马逊 Compreh Trusted Advisor end 上使用 Amazon Comprehend](manage-endpoints-trusted-advisor.md)。有关检查和描述的完整列表，请参阅 [Trusted Advisor 最佳实践](https://aws.amazon.com/premiumsupport/technology/trusted-advisor/best-practice-checklist/)。

有关管理终端节点的更多信息，请参阅以下主题。
+ [使用 Amazon Comprehend 终端节点](using-endpoints.md)
+ [正在监控 Amazon Comprehend 终端节点](manage-endpoints-monitor.md)
+ [正在更新 Amazon Comprehend 终端节点](manage-endpoints-update.md)
+ [在亚马逊 Compreh Trusted Advisor end 上使用 Amazon Comprehend](manage-endpoints-trusted-advisor.md)
+ [正在删除 Amazon Comprehend 终端节点](manage-endpoints-delete.md)

**重要**  
实时自定义分类的成本取决于您设置的吞吐量和终端节点处于活动状态的时间长度。如果您不再使用终端节点，或者长时间不使用该终端节点，则应设置自动扩缩策略以降低成本。或者，如果您不再使用某个终端节点，则可以删除该终端节点，以免产生额外费用。有关更多信息，请参阅 [使用终端节点自动扩缩](comprehend-autoscaling.md)。

# 使用 Amazon Comprehend 终端节点
<a name="using-endpoints"></a>

您可以使用自定义模型创建终端节点来运行实时分析。终端节点包括托管资源，这些资源使您的自定义模型可用于实时推理。

Amazon Comprehend 使用*推理单元* (IU) 为终端节点分配吞吐量。一个 IU 表示每秒 100 个字符的数据吞吐量。您最多可以为终端节点配置 10 个推理单元。您可以通过更新终端节点来向上或向下扩展终端节点的吞吐量。

如果您的输入文档包括半结构化文档或图像文件，则从输入文件中提取的字符的吞吐量为每秒 100 个字符。您为端点配置的 IUs 数量取决于输入文档的字符密度。

 [ClassifyDocument](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ClassifyDocument.html)和 [DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html)API 响应包括每页输入的字符数。您可以使用此信息来估算要配置的推理单元数量，以实现所需的吞吐量。

完成实时分析后，请删除终端节点，因为只要终端节点处于活动状态，就会继续收费。当您准备好进行进一步的实时分析时，可以创建另一个终端节点。

有关终端节点费用的更多信息，请参阅 [Amazon Comprehend 定价](https://aws.amazon.com/comprehend/pricing/)。

创建终端节点后，您可以使用 Amazon 对其进行监控 CloudWatch，对其进行更新以更改其推理单位，或者在不再需要时将其删除。有关更多信息，请参阅 [正在监控 Amazon Comprehend 终端节点](manage-endpoints-monitor.md)。

# 正在监控 Amazon Comprehend 终端节点
<a name="manage-endpoints-monitor"></a>

您可以通过增加或减少推理单元的数量（IUs）来调整终端节点的吞吐量。有关更新您的终端节点的更多信息，请参阅 [正在更新 Amazon Comprehend 终端节点](manage-endpoints-update.md)。

您可以通过使用 Amazon CloudWatch 控制台监控终端节点的使用情况来确定如何最好地调整终端节点的吞吐量。

**使用监控您的终端节点使用情况 CloudWatch**

1. 登录 AWS 管理控制台 并打开[CloudWatch 控制台](https://console.aws.amazon.com/cloudwatch/)。

1. 请在左侧选择**指标**，然后选择**全部指标**。

1. 在**全部指标**下，选择 **Comprehend**。  
![\[控制台显示指标页面，显示了 Comprehend 面板。\]](http://docs.aws.amazon.com/zh_cn/comprehend/latest/dg/images/cloudwatch-metrics1.png)

1.  CloudWatch 控制台显示 **Comprehend** 指标的维度。选择**EndpointArn**维度。  
![\[控制台显示的 Amazon Comprehend 指标页面显示该维度。EndpointArn\]](http://docs.aws.amazon.com/zh_cn/comprehend/latest/dg/images/cloudwatch-metrics2.png)

   控制台会显示每个终端节点**InferenceUtilization**的**ProvisionedInferenceUnits**RequestedInferenceUnits**ConsumedInferenceUnits******、、和。  
![\[CloudWatch 控制台显示了四个指标。\]](http://docs.aws.amazon.com/zh_cn/comprehend/latest/dg/images/cloudwatch-metrics3.png)

   选择四个指标，然后导航到 “**图表化指标**” 选项卡。

1. 将**RequestedInferenceUnits**和的统计数据列设置**ConsumedInferenceUnits**为**总和**。

1. 将的 “统计数据” 列设置**InferenceUtilization**为 “**总和**”。

1. 将 “统计数据” 列设置**ProvisionedInferenceUnits**为 “**平均值**”。

1. 将所有指标的周期列更改为 **1 分钟**。

1. 选择**InferenceUtilization**并选择箭头，将其移动到单独**的 Y 轴**。

   您的图表已准备好进行分析。

     
![\[显示图表指标的控制台显示屏。\]](http://docs.aws.amazon.com/zh_cn/comprehend/latest/dg/images/graphed_metrics_endpoint.png)

根据这些 CloudWatch 指标，您还可以设置 auto scaling 以自动调整终端节点的吞吐量。有关更多在终端节点上使用自动扩缩信息，请参阅 [使用终端节点自动扩缩](comprehend-autoscaling.md)。


+ **ProvisionedInferenceUnits**-此指标表示发出请求 IUs 时的平均预配置数量。
+  **RequestedInferenceUnits**-这是基于提交给服务且发送待处理的每个请求的使用情况。这有助于将发送的待处理请求与实际处理的请求进行比较，而不会受到限制 () ConsumedInferenceUnits。该指标的值的计算方法是，将发送的待处理字符数除以每分钟可处理的字符数，得出 1 IU。
+ **ConsumedInferenceUnits**-这是基于向服务成功处理（未限制）提交的每个请求的使用情况。当您将消耗的资源与预配置的消耗量进行比较时，这会很有帮助。 IUs该指标的计算方法是将处理的字符数除以每分钟1个 IU 可以处理的字符数。
+ **InferenceUtilization**-这是根据请求发出的。该值的计算方法是将 IUs 定义的**ConsumedInferenceUnits**消耗量除以**ProvisionedInferenceUnits**并转换为 100 中的百分比。

**注意**  
 只有成功请求时才会发出所有指标。如果该指标来自因内部服务器错误或客户错误而受到节流或失败的请求，则不会显示该指标。

# 正在更新 Amazon Comprehend 终端节点
<a name="manage-endpoints-update"></a>

通常，在创建终端节点之后，您对吞吐量的需求水平可能会发生变化，或者您对需求的首次估算会发生变化。发生这种情况时，可能需要更新您的终端节点以向上或向下调整吞吐量。吞吐量取决于您为终端节点配置的推理单元数量。每个推理单元表示每秒 100 个字符的吞吐量，每秒最多可处理 2 个文档。您可能还想更新与终端节点关联的模型的版本。编辑终端节点时，可以为该终端节点选择不同版本的模型。

为终端节点添加标签也能帮助将它们整理得井井有条。这也可以在更新终端节点时来完成。有关终端节点的更多信息，请参阅 [标记您的资源](tagging.md)

**要更新终端节点（控制台）**

1. 登录 AWS 管理控制台 并打开亚马逊 Comprehend 控制台，网址为 [https://console.aws.amazon.com/comprehend/](https://console.aws.amazon.com/comprehend/)

1. 从左侧菜单中，选择**终端节点**。

1. 从**分类器**列表中，选择要更新终端节点的自定义模型的名称，然后点击链接。此时将显示模型详细信息页面。

1. 在模型详细信息页面中，选择版本详细信息。将显示终端节点列表。

1. 选中终端节点对应的终端节点复选框。在终端节点列表的右上角，选择**操作**图标。

1. 选择**编辑**。您可以更新已配置的标签 IUs 和编辑标签。

1. 保存更改。

1. 要编辑配置终端节点的推理单元的数量，请选择**编辑**。

1. 输入要分配给终端节点的更新的推理单元数量。每个单元代表每秒 100 个字符的吞吐量。您可以为每个终端节点分配最多 10 个推理单元。
**注意**  
使用终端节点的成本取决于运行时间和吞吐量（基于推理单元的数量）。因此，增加推理单元的数量会增加操作成本。有关更多信息，请参阅 [Amazon Comprehend 定价](https://aws.amazon.com/comprehend/pricing)。

1. 选择**编辑终端节点**。显示终端节点详细信息页面。

1. 请从页面顶部的页面导览痕迹中选择模型，以确认终端节点正在更新。在自定义模型详细信息页面上，导航到**终端节点**列表，并确认终端节点旁边是否显示**正在更新**。更新完成后，状态将显示为**就绪**。

   以下示例演示了如何在 AWS CLI 中使用该*UpdateEndpoint*操作。

   此示例的格式适用于 Unix、Linux 和 macOS。对于 Windows，请将每行末尾的反斜杠 (\$1) Unix 行继续符替换为脱字号 (^)。

   ```
   aws comprehend update-endpoint \
       --desired-inference-units updated number of inference units \
       --desired-model-arn arn:aws:comprehend:region:account-id:model type/model name \
       --desired-data-access-role-arn arn:aws:iam:account id:role/role name
       --endpoint-arn arn:aws:comprehend:region:account id:endpoint/endpoint name
   ```

   如果此操作成功，则 Amazon Comprehend 会发送回带有空 HTTP 正文的 HTTP 200 响应。

1. 要编辑附加到终端节点的自定义模型，请从自定义模型详细信息页面导航到**终端节点**列表。

1. 选择要更改的终端节点，然后选择**编辑**。

1. 在终端节点设置页面的**选择分类器模型**或**选择识别器模型**下（视终端节点而定），您可以在下拉列表中搜索模型。选择您所需的模型。

1. 在**选择版本**下，您可以搜索所需的模型版本。选择版本。

1. 选择**编辑终端节点**进行保存。

# 在亚马逊 Compreh Trusted Advisor end 上使用 Amazon Comprehend
<a name="manage-endpoints-trusted-advisor"></a>

AWS Trusted Advisor 是一款在线工具，可提供建议，帮助您按照 AWS 最佳实践配置资源。

如果您有 Basic 或 Developer Support 计划，则可以使用 Trusted Advisor 控制台访问 “服务限制” 类别中的所有检查和 “安全” 类别中的六项检查。如果您有商业或企业支持计划，则可以使用 Trusted Advisor 控制台和 [AWS 支持 API](https://docs.aws.amazon.com/awssupport/latest/user/Welcome.html) 访问所有支 Trusted Advisor 票。

Amazon Comprehend 支持以下检查，通过提供 Trusted Advisor 切实可行的建议，帮助客户优化其亚马逊 Comprehend 终端节点的成本和安全。

## Amazon Comprehend 未充分利用的终端节点
<a name="manage-endpoints-trusted-advisor-underutilized-endpoints"></a>

**Amazon Comprehend 未充分利用终端节点**检查会评估终端节点的吞吐量配置。当终端节点未被主动用于实时推理请求时，此检查会提示您。超过 15 天未使用的终端节点会被视为未充分利用。所有终端节点均根据设置的吞吐量以及终端节点处于活动状态的时长来累积费用。如果终端节点在过去 15 天内尚未使用，我们建议使用[应用程序 Autoscaling](https://docs.aws.amazon.com/autoscaling/application/userguide/what-is-application-auto-scaling.html) 为资源定义扩缩策略。对于过去 30 天内未使用且已定义自动扩缩策略的终端节点，我们建议您使用异步推理或将其删除。这些检查结果每天自动刷新一次，可以在 Trusted Advisor 控制台的**CostOptimization**类别下查看。

**查看所有终端节点的使用状态和相应的建议**

1. 登录 AWS 管理控制台 并打开 Trusted Advisor 控制台。

1. 在导航窗格中，选择支**CostOptimization**票类别。

1. 在类别页面上，您可以查看每种检查类别的摘要：
   + **建议的操作（红色）**- Trusted Advisor 建议检查的操作。
   + **建议调查（黄泽）** – Trusted Advisor 检测到检查的可能问题。
   + **未检测到问题（绿色）**- Trusted Advisor 未检测到检查问题。
   + **排除的项目（灰色）**：包含排除项目的检查次数，例如您希望检查忽略的资源。

1. 选择 **Amazon Comprehend 未充分利用的终端节点检查**以查看检查说明和以下详细信息：
   + **提示标准** – 描述检查将更改状态的阈值。
   + **建议的操作** – 描述此检查的建议操作。
   + **资源表：**此表根据您的建议列出了您的终端节点详细信息以及每个终端节点的状态。

1. 在资源表中，如果终端节点因**过去 30 天未使用**警告而被标记为**建议调查**，则可以导航到 Amazon Comprehend 控制台上的终端节点详情页面。
   + 如果您不想再使用此终端节点，请选择**删除**。
   + 再次选择**删除**以确认删除。显示自定义模型的详细信息页面。确认您删除的终端节点旁边显示**正在删除**。删除后，终端节点将从**终端节点**列表中删除。

1. 在 Trusted Advisor 控制台的资源表中，如果某个终端节点因过去 15 天内未使用而被标记为 “**调查推荐**” 状态，并且该终端节点已被 AutoScaling 禁用，则可以导航到 Amazon Comprehend 控制台上的终端节点详细信息页面来调整该终端节点。
   + 如果要减少为此终端节点配置的吞吐量，请单击**编辑**。输入要分配给终端节点的推理单元的更新数量，然后选中要确认的复选框，然后选择**编辑终端节点**。更新完成后，状态将显示为**就绪**。
   + 如果您想在终端节点上自动设置终端节点配置，而不是手动调整吞吐量配置，我们建议您使用**应用程序 Autoscaling**。

1. 在 Trusted Advisor 控制台的资源表中，如果由于 Used Activity 原因将终端节点标记为 “**未检测到问题**” 状态，则表示该端点正在被**积极用于**运行实时推理请求，不建议采取任何操作。

以下示例显示了 Trusted Advisor 控制台上的 CostOptimization 类别视图：

![\[成本优化检查的输出示例。\]](http://docs.aws.amazon.com/zh_cn/comprehend/latest/dg/images/TA_cost_optimization_new.png)


## Amazon Comprehend 终端节点访问风险
<a name="manage-endpoints-trusted-advisor-endpoint-access-risk"></a>

**Amazon Comprehend 终端节点访问风险**检查会评估使用客户自主管理型密钥加密基础模型的终端节点的 AWS Key Management Service (AWS KMS) 密钥权限。如果禁用了客户自主管理型密钥，或者更改了密钥策略以针对 Amazon Comprehend 更改允许的权限，则终端节点可用性可能会受到影响。如果密钥已禁用，我们建议您启用它。如果密钥策略已更改并且您想要继续使用终端节点，我们建议您更新密钥策略。检查结果在一天中会自动刷新多次。可以在 Trusted Advisor 控制台的**容错**类别下查看此检查。

**查看您的亚马逊 Comprehend 终端节点的 AWS KMS 密钥状态**

1. 登录 AWS 管理控制台 并打开 Trusted Advisor 控制台。

1. 在导航窗格中，选择支**FaultTolerance**票类别。

1. 在类别页面上，您可以查看每种检查类别的摘要：
   + **建议的操作（红色）**- Trusted Advisor 建议检查的操作。
   + **建议调查（黄色）**： Trusted Advisor 检测到检查存在的可能问题。
   + **未检测到问题（绿色）**- Trusted Advisor 未检测到检查问题。
   + **排除的项目（灰色）** – 包含排除项目的检查数，例如您希望检查忽略的资源。

1. 选择 Amazon Comprehend 终端节点访问风险检查，即可查看检查说明和以下详细信息：
   + **提示标准**：描述检查将更改状态的阈值。
   + **建议的操作** – 描述此检查的建议操作。
   + **资源表：**此表列出了您的 KMS 加密终端节点详细信息以及每个终端节点的状态，具体取决于是否有建议的操作。

1. 在资源表中，如果终端节点被标记为 “**操作推荐**” 状态，请选择 KMS KeyId 列中的链接，您将被重定向到相应的 AWS KMS 密钥页面。
   + 要启用已禁用的 AWS KMS 密钥，请选择**按键操作**，然后选择**启用**。
   + 如果密钥状态列为**已启用**，请在密钥策略部分中选择**切换到策略视图**来更新密钥策略。编辑密钥策略文档以向 Amazon Comprehend 提供必要的权限，然后选择**保存更改**。

以下是 Trusted Advisor 控制台上 FaultTolerance 类别视图的示例：

![\[容错检查的输出示例。\]](http://docs.aws.amazon.com/zh_cn/comprehend/latest/dg/images/TA_fault_tolerance_checks_new.png)


也可以通过参阅 AWS 支持 API 的 Trusted Advisor 部分来查看这些检查及其结果。

要了解有关使用设置警报的更多信息 CloudWatch，请参阅：[使用创建 Trusted Advisor 警报 CloudWatch](https://docs.aws.amazon.com/awssupport/latest/user/cloudwatch-metrics-ta.html)。有关完整 Trusted Advisor 的最佳实践检查，请参阅：[AWS Trusted Advisor 最佳实践清单。](https://aws.amazon.com/premiumsupport/technology/trusted-advisor/best-practice-checklist/)

# 正在删除 Amazon Comprehend 终端节点
<a name="manage-endpoints-delete"></a>

一旦您不再需要您的终端节点，就应该将其删除，这样您就不会因此而产生费用。您可以随时从**终端节点**部分轻松创建另一个终端节点。

**删除终端节点 (控制台)**

1. 登录 AWS 管理控制台 并打开亚马逊 Comprehend 控制台，网址为 [https://console.aws.amazon.com/comprehend/](https://console.aws.amazon.com/comprehend/)

1. 从左侧菜单中，选择**终端节点**。

1. 从**终端节点列表**中，找到您要删除的终端节点。您可以搜索或筛选所有终端节点以找到所需的终端节点。

1. 选中要删除的终端节点对应的终端节点复选框。在终端节点列表的右上角，选择**操作**图标。

1. 选择 **删除**。

1. 再次选择**删除**以确认删除。显示终端节点页面。确认您删除的终端节点旁边显示**正在删除**。删除后，终端节点将从**终端节点**列表中删除。





**删除终端节点 (AWS CLI)**

以下示例演示了如何在 AWS CLI 中使用该*DeleteEndpoint*操作。

此示例的格式适用于 Unix、Linux 和 macOS。对于 Windows，请将每行末尾的反斜杠 (\$1) Unix 行继续符替换为脱字号 (^)。

```
aws comprehend delete-endpoint \
    --endpoint-arn arn:aws:comprehend:region:account-id endpoint/endpoint name
```

如果此操作成功，则 Amazon Comprehend 会发送回带有空 HTTP 正文的 HTTP 200 响应。

# 使用终端节点自动扩缩
<a name="comprehend-autoscaling"></a>

您可以使用自动扩缩自动设置终端节点配置以满足您的容量需求，而无需手动调整为文档分类终端节点和实体识别器终端节点配置的推理单元数量。

使用自动扩缩调整为终端节点预置的推理单元数量有两种方法：
+ [目标跟踪](targettracking.md)：设置自动扩缩以根据使用情况调整终端节点配置以满足容量需求。
+ [计划扩展](ScheduledScaling.md)：设置自动扩缩以按照指定计划调整终端节点配置以满足容量需求。

只能使用 AWS Command Line Interface (AWS CLI) 设置自动缩放。有关自动扩缩的更多信息，请参阅[什么是应用程序自动扩缩？](https://docs.aws.amazon.com/autoscaling/application/userguide/what-is-application-auto-scaling.html)

# 目标跟踪
<a name="targettracking"></a>

通过目标跟踪，您可以根据使用情况调整终端节点配置，以满足您的容量需求。推理单元的数量会自动调整，使已利用容量保持在预配置容量的目标百分比之内。您可以使用目标跟踪来适应文档分类终端节点和实体识别器终端节点的临时使用激增。有关更多信息，请参阅 [Application Auto Scaling 的目标跟踪扩缩策略](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking.html)。

**注意**  
以下示例的格式适用于 Unix、Linux 和 macOS。对于 Windows，请将每行末尾的反斜杠 (\$1) Unix 行继续符替换为脱字号 (^)。

## 设置目标跟踪
<a name="setup-target-tracking"></a>

要为终端节点设置目标跟踪，您可以使用 AWS CLI 命令注册可扩展目标，然后创建扩展策略。可扩展目标将推理单元定义为用于调整终端节点配置的资源，扩缩策略定义了控制预配置容量自动扩缩的指标。

**设置目标跟踪**

1. 注册可扩展目标。以下示例注册了一个可扩展的目标，以调整终端节点配置，其最小容量为 1 个推理单元，最大容量为 2 个推理单元。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. 要验证可扩展目标的注册情况，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling describe-scalable-targets \
       --service-namespace comprehend \
       --resource-id endpoint ARN
   ```

1. 为扩缩策略创建目标跟踪配置，并将该配置保存在名为 `config.json` 的文件中。以下是文档分类端点的目标跟踪配置示例，其目标是将 InferenceUtilization 指标保持在 70%。

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

   以下是实体识别器端点的示例：

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

1. 创建扩缩策略。以下示例根据 `config.json` 文件中定义的目标跟踪配置创建扩缩策略。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

## 注意事项
<a name="considerations"></a>

在 Comprehend 端点上使用目标跟踪时，需要考虑以下注意事项：
+ 只有成功请求时才会发出终端节点指标。对于因内部服务器错误或客户错误而受到限制或失败的请求，则不会显示指标。
+ 当缺少数据点时，后备 CloudWatch 警报状态将更改为`INSUFFICIENT_DATA `。发生这种情况时，Application Auto Scaling 将无法扩展您的终端节点。
+ 公制数学可能有助于解决此限制。例如，要在未报告任何指标时使用值 0，请使用`FILL(m1,0)`函数 where is the met `m1` rics。请务必测试您的配置，以确保其行为符合预期。有关更多选项，请参阅[使用指标数学创建目标跟踪策略](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking-metric-math.html)。

## 正在删除目标跟踪
<a name="remove-target-tracking"></a>

要删除终端节点的目标跟踪，可以使用 AWS CLI 命令删除扩展策略，然后取消注册可扩展目标。

**删除目标跟踪**

1. 删除扩缩策略。以下示例删除了指定扩缩策略。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy
   ```

1. 取消注册可扩展目标。以下示例将注销指定的可扩展目标。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```

# 计划扩展
<a name="ScheduledScaling"></a>

通过计划扩缩，您可以调整终端节点的配置以适应指定计划的容量需求。计划扩缩会自动调整推理单元的数量，以适应特定时间的使用量激增。您可以对文档分类终端节点和实体识别器终端节点使用计划扩缩。有关计划扩缩的更多信息，请参阅[应用程序自动扩缩中的计划扩缩](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-scheduled-scaling.html)。

**注意**  
以下示例的格式适用于 Unix、Linux 和 macOS。对于 Windows，请将每行末尾的反斜杠 (\$1) Unix 行继续符替换为脱字号 (^)。

## 设置计划扩缩
<a name="setup-scheduled-scaling"></a>

要为终端节点设置定时扩展，可以使用 AWS CLI 命令注册可扩展目标，然后创建计划操作。可扩展目标将推理单元定义为用于调整终端节点配置的资源，而计划操作控制了预配置容量在特定时间的自动扩缩。

**设置计划扩缩**

1. 注册可扩展目标。以下示例注册了一个可扩展的目标，以调整终端节点配置，其最小容量为 1 个推理单元，最大容量为 2 个推理单元。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. 创建计划操作。以下示例创建了一个计划操作，以在每天 12:00 UTC 自动调整预配置容量，最小为 2 个推理单元，最大为 5 个推理单元。有关时间表达式和计划扩缩的更多信息，请参阅[计划表达式](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html)。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

## 删除计划扩缩
<a name="remove-scheduled-scaling"></a>

要删除终端节点的计划扩展，可以使用 AWS CLI 命令删除计划操作，然后取消注册可扩展目标。

**删除计划扩缩**

1. 删除计划操作。以下示例将删除指定的计划操作。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

1. 取消注册可扩展目标。以下示例将注销指定的可扩展目标。

   对于文档分类端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   对于实体识别器端点，请使用以下 AWS CLI 命令：

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```