

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 推論エンドポイントの Amazon SageMaker AI 拡張メトリクス
<a name="monitoring-cloudwatch-enhanced-metrics"></a>

拡張メトリクスは、Amazon SageMaker AI リアルタイムエンドポイントのインスタンスレベルとコンテナレベルのモニタリングデータを提供します。拡張メトリクスを有効にすると、Amazon CloudWatch メトリクスには`InstanceId`、詳細なインスタンスごと`ContainerId`、コンテナごと、GPU ごとの可視性の 、、および `AcceleratorId`ディメンション (可用性は名前空間によって異なります) を含めることができます。拡張メトリクスは、単一モデルエンドポイントと推論コンポーネントで使用できます。マルチコンテナエンドポイント (MCE) はインスタンスレベルの拡張メトリクスをサポートしますが、コンテナレベルのメトリクスはサポートしていません。

拡張メトリクスの主な特性:
+ **インスタンスレベルの粒度**。使用率と呼び出しメトリクスには、エンドポイントをホストする特定のインスタンスを識別する`InstanceId`ディメンションが含まれます。これは、すべてのリアルタイムエンドポイントで使用できます。
+ **コンテナレベルの粒度**。推論コンポーネントを使用するエンドポイントの場合、メトリクスには、モデルを実行している特定のコンテナを識別する`ContainerId`ディメンションが含まれます。コンテナレベルのディメンションは、`AWS/SageMaker`名前空間 (呼び出しメトリクス) と`/aws/sagemaker/InferenceComponents`名前空間 (使用率メトリクス) の両方に表示されます。
+ **GPU ごとの粒度**。GPU 使用率メトリクスには、インスタンス上の特定の GPU を識別する`AcceleratorId`ディメンションが含まれます。
+ **設定可能な発行頻度**。メトリクスの発行間隔は、10、30、60、120、180、240、または 300 秒に設定できます。デフォルト値は 60 秒です。この間隔は、拡張メトリクスが有効になっているかどうかに関係なく、使用率メトリクスに適用されます。拡張メトリクスを有効にすると、呼び出しメトリクスにも適用されます。

## 拡張メトリクスの有効化
<a name="enhanced-metrics-enabling"></a>

[CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html) [MetricsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_MetricsConfig.html) API を呼び出すときに MetricsConfig パラメータ`True`で `EnableEnhancedMetrics`を に設定することで、拡張メトリクスを有効にします。

`MetricsConfig` パラメータには次のフィールドがあります。


**MetricsConfig パラメータ**  

| パラメータ | タイプ | [Required] (必須) | デフォルト | 説明  | 
| --- | --- | --- | --- | --- | 
| EnableEnhancedMetrics | ブール値 | いいえ | False | インスタンスレベルとコンテナレベルのメトリクスディメンションを有効にします。 | 
| MetricPublishFrequencyInSeconds | 整数 | いいえ | 60 | メトリクスが Amazon CloudWatch に発行される秒単位の間隔。デフォルトは `60` です。有効な値: `10`、`30`、、`60`、`120`、`180``240`、`300`。`EnableEnhancedMetrics` を に設定すると`False`、この間隔は使用率メトリクスにのみ適用されます。呼び出しメトリクスは引き続きデフォルトの 60 秒間隔で発行されます。に設定すると`True`、この間隔は使用率メトリクスと呼び出しメトリクスの両方に適用されます。 | 

**注記**  
`MetricsConfig` はエンドポイント設定レベルで設定されます。同じエンドポイント上の個々の推論コンポーネントに対して異なる設定を行うことはできません。

既存のエンドポイントで拡張メトリクスを有効にするには、必要な設定で新しいエンドポイント`MetricsConfig`設定を作成し、新しいエンドポイント設定名で [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html) を呼び出します。これにより、ブルー/グリーンデプロイまたはローリングデプロイがトリガーされます。拡張メトリクスは、デプロイが完了するまで表示されません。既に設定されているエンドポイント`MetricsConfig`の設定を変更する場合も、同じプロセスが適用されます。

を設定すると`MetricsConfig`、[DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html) と [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html) の両方がレスポンス`MetricsConfig`に戻ります。

拡張メトリクスを有効にすると、SageMaker AI は、使用率メトリクス`/aws/sagemaker/Endpoints`、`AWS/SageMaker`呼び出しメトリクス、推論コンポーネント使用率メトリクス`/aws/sagemaker/InferenceComponents`の 3 つの CloudWatch 名前空間にわたってメトリクスにディメンションを追加します。

## インスタンスレベルの使用率メトリクス
<a name="enhanced-metrics-instance-utilization"></a>

`/aws/sagemaker/Endpoints` 名前空間には、推論コンポーネントを使用するエンドポイントを含む、すべてのリアルタイムエンドポイントの使用率メトリクスが含まれます。拡張メトリクスを有効にする`InstanceId`と、 および `AcceleratorId` (GPU メトリクスのみ) ディメンションが既存の名前空間ディメンションとともに使用可能になります。メトリクスとディメンションの完全なリストについては、「」を参照してください[SageMaker AI エンドポイントメトリクス](monitoring-cloudwatch.md#cloudwatch-metrics-endpoints)。

拡張メトリクスを有効にすると、次の追加ディメンションを使用できます。


**インスタンスレベルの使用率メトリクスの追加ディメンション**  

| ディメンション | 説明 | 
| --- | --- | 
| InstanceId | 特定のインスタンスの使用率メトリクスをフィルタリングします。 | 
| AcceleratorId | (GPU メトリクスのみ) 特定の GPU の使用率メトリクスをフィルタリングします。 | 

## インスタンスレベルとコンテナレベルの呼び出しメトリクス
<a name="enhanced-metrics-invocation"></a>

`AWS/SageMaker` 名前空間には呼び出しメトリクスが含まれます。拡張メトリクスを有効にする`InstanceId`と、 および `ContainerId` (推論コンポーネントのみ) ディメンションが既存の名前空間ディメンションとともに使用可能になります。メトリクスとディメンションの完全なリストについては、「」を参照してください[SageMaker AI エンドポイント呼び出しメトリクス](monitoring-cloudwatch.md#cloudwatch-metrics-endpoint-invocation)。

拡張メトリクスを有効にすると、次の追加ディメンションを使用できます。


**呼び出しメトリクスの追加ディメンション**  

| ディメンション | 説明 | 
| --- | --- | 
| InstanceId | 特定のインスタンスの呼び出しメトリクスをフィルタリングします。 | 
| ContainerId | (推論コンポーネントのみ) 特定のコンテナの呼び出しメトリクスをフィルタリングします。 | 

## コンテナレベルの使用率メトリクス
<a name="enhanced-metrics-container"></a>

`/aws/sagemaker/InferenceComponents` 名前空間には、推論コンポーネントを使用するエンドポイントの使用率メトリクスが含まれます。拡張メトリクスを有効にすると、`InstanceId`、`ContainerId`、および `AcceleratorId` (GPU メトリクスのみ) ディメンションが既存の名前空間ディメンションとともに使用可能になります。メトリクスとディメンションの完全なリストについては、「」を参照してください[SageMaker AI 推論コンポーネントのメトリクス](monitoring-cloudwatch.md#cloudwatch-metrics-inference-component)。

拡張メトリクスを有効にすると、次の追加ディメンションを使用できます。


**コンテナレベルの使用率メトリクスの追加ディメンション**  

| ディメンション | 説明 | 
| --- | --- | 
| InstanceId | 特定のインスタンスの使用率メトリクスをフィルタリングします。 | 
| ContainerId | 特定のコンテナの使用率メトリクスをフィルタリングします。 | 
| AcceleratorId | (GPU メトリクスのみ) 特定の GPU の使用率メトリクスをフィルタリングします。 | 

## 設定可能なメトリクスの頻度
<a name="enhanced-metrics-frequency"></a>

メトリクスが CloudWatch に発行される間隔を設定できます。デフォルトの頻度は 60 秒です。

**有効な値:** 10、30、60、120、180、240、または 300 秒。

`EnableEnhancedMetrics` が に設定されている場合`False`、この頻度は使用率メトリクスにのみ適用されます。呼び出しメトリクスは引き続きデフォルトの 60 秒間隔で発行されます。に設定すると`True`、この頻度は使用率メトリクスと呼び出しメトリクスの両方に適用されます。

**注記**  
60 秒未満の間隔 (高解像度) で発行されたメトリクスは、3 時間保持されます。

標準 CloudWatch 料金は、一意のディメンションの組み合わせごとにメトリクスごとに適用されます。拡張メトリクスは、各インスタンス、コンテナ、GPU が追加のディメンションの組み合わせを作成するため、メトリクスストリームの数を増やします。料金の詳細については、[Amazon CloudWatch の料金](https://aws.amazon.com/cloudwatch/pricing/)」を参照してください。

## コード例: 拡張メトリクスの設定
<a name="enhanced-metrics-code-examples"></a>

次の例は、拡張メトリクスを有効にしてエンドポイント設定を作成する方法と、設定を検証する方法を示しています。

### 拡張メトリクスを使用してエンドポイント設定を作成する
<a name="enhanced-metrics-create-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example 拡張メトリクスを使用してエンドポイント設定を作成する**  

```
import boto3

sagemaker_client = boto3.client('sagemaker')

response = sagemaker_client.create_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}',
    ProductionVariants=[
        {
            'VariantName': '{{AllTraffic}}',
            'ModelName': '{{my-model}}',
            'InstanceType': '{{ml.m5.xlarge}}',
            'InitialInstanceCount': {{2}},
        }
    ],
    MetricsConfig={
        'EnableEnhancedMetrics': True,
        'MetricPublishFrequencyInSeconds': {{60}}
    }
)
```

------
#### [ AWS CLI ]

**Example 拡張メトリクスを使用してエンドポイント設定を作成する**  

```
aws sagemaker create-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --production-variants file://production-variants.json \
    --metrics-config file://metrics-config.json
```
ここでは `metrics-config.json` に以下が含まれます。  

```
{
    "EnableEnhancedMetrics": true,
    "MetricPublishFrequencyInSeconds": {{60}}
}
```

------

### 拡張メトリクス設定の検証
<a name="enhanced-metrics-verify-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example 拡張メトリクス設定の検証**  

```
response = sagemaker_client.describe_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}'
)
print(response['MetricsConfig'])
# {'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60}

response = sagemaker_client.describe_endpoint(
    EndpointName='{{my-endpoint}}'
)
print(response['MetricsConfig'])
```

------
#### [ AWS CLI ]

**Example 拡張メトリクス設定の検証**  

```
aws sagemaker describe-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --query 'MetricsConfig'
```

```
aws sagemaker describe-endpoint \
    --endpoint-name {{my-endpoint}} \
    --query 'MetricsConfig'
```

------