翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
推論エンドポイントの Amazon SageMaker AI 拡張メトリクス
拡張メトリクスは、Amazon SageMaker AI リアルタイムエンドポイントのインスタンスレベルとコンテナレベルのモニタリングデータを提供します。拡張メトリクスを有効にすると、Amazon CloudWatch メトリクスにはInstanceId、詳細なインスタンスごとContainerId、コンテナごと、GPU ごとの可視性の 、、および AcceleratorIdディメンション (可用性は名前空間によって異なります) を含めることができます。拡張メトリクスは、単一モデルエンドポイントと推論コンポーネントで使用できます。マルチコンテナエンドポイント (MCE) はインスタンスレベルの拡張メトリクスをサポートしますが、コンテナレベルのメトリクスはサポートしていません。
拡張メトリクスの主な特性:
-
インスタンスレベルの粒度。使用率と呼び出しメトリクスには、エンドポイントをホストする特定のインスタンスを識別する
InstanceIdディメンションが含まれます。これは、すべてのリアルタイムエンドポイントで使用できます。 -
コンテナレベルの粒度。推論コンポーネントを使用するエンドポイントの場合、メトリクスには、モデルを実行している特定のコンテナを識別する
ContainerIdディメンションが含まれます。コンテナレベルのディメンションは、AWS/SageMaker名前空間 (呼び出しメトリクス) と/aws/sagemaker/InferenceComponents名前空間 (使用率メトリクス) の両方に表示されます。 -
GPU ごとの粒度。GPU 使用率メトリクスには、インスタンス上の特定の GPU を識別する
AcceleratorIdディメンションが含まれます。 -
設定可能な発行頻度。メトリクスの発行間隔は、10、30、60、120、180、240、または 300 秒に設定できます。デフォルト値は 60 秒です。この間隔は、拡張メトリクスが有効になっているかどうかに関係なく、使用率メトリクスに適用されます。拡張メトリクスを有効にすると、呼び出しメトリクスにも適用されます。
拡張メトリクスの有効化
CreateEndpointConfig MetricsConfig API を呼び出すときに MetricsConfig パラメータTrueで EnableEnhancedMetricsを に設定することで、拡張メトリクスを有効にします。
MetricsConfig パラメータには次のフィールドがあります。
| パラメータ | タイプ | [Required] (必須) | デフォルト | 説明 |
|---|---|---|---|---|
EnableEnhancedMetrics |
ブール値 | いいえ | False |
インスタンスレベルとコンテナレベルのメトリクスディメンションを有効にします。 |
MetricPublishFrequencyInSeconds |
整数 | いいえ | 60 |
メトリクスが Amazon CloudWatch に発行される秒単位の間隔。デフォルトは |
注記
MetricsConfig はエンドポイント設定レベルで設定されます。同じエンドポイント上の個々の推論コンポーネントに対して異なる設定を行うことはできません。
既存のエンドポイントで拡張メトリクスを有効にするには、必要な設定で新しいエンドポイントMetricsConfig設定を作成し、新しいエンドポイント設定名で UpdateEndpoint を呼び出します。これにより、ブルー/グリーンデプロイまたはローリングデプロイがトリガーされます。拡張メトリクスは、デプロイが完了するまで表示されません。既に設定されているエンドポイントMetricsConfigの設定を変更する場合も、同じプロセスが適用されます。
を設定するとMetricsConfig、DescribeEndpoint と DescribeEndpointConfig の両方がレスポンスMetricsConfigに戻ります。
拡張メトリクスを有効にすると、SageMaker AI は、使用率メトリクス/aws/sagemaker/Endpoints、AWS/SageMaker呼び出しメトリクス、推論コンポーネント使用率メトリクス/aws/sagemaker/InferenceComponentsの 3 つの CloudWatch 名前空間にわたってメトリクスにディメンションを追加します。
インスタンスレベルの使用率メトリクス
/aws/sagemaker/Endpoints 名前空間には、推論コンポーネントを使用するエンドポイントを含む、すべてのリアルタイムエンドポイントの使用率メトリクスが含まれます。拡張メトリクスを有効にするInstanceIdと、 および AcceleratorId (GPU メトリクスのみ) ディメンションが既存の名前空間ディメンションとともに使用可能になります。メトリクスとディメンションの完全なリストについては、「」を参照してくださいSageMaker AI エンドポイントメトリクス。
拡張メトリクスを有効にすると、次の追加ディメンションを使用できます。
| ディメンション | 説明 |
|---|---|
InstanceId |
特定のインスタンスの使用率メトリクスをフィルタリングします。 |
AcceleratorId |
(GPU メトリクスのみ) 特定の GPU の使用率メトリクスをフィルタリングします。 |
インスタンスレベルとコンテナレベルの呼び出しメトリクス
AWS/SageMaker 名前空間には呼び出しメトリクスが含まれます。拡張メトリクスを有効にするInstanceIdと、 および ContainerId (推論コンポーネントのみ) ディメンションが既存の名前空間ディメンションとともに使用可能になります。メトリクスとディメンションの完全なリストについては、「」を参照してくださいSageMaker AI エンドポイント呼び出しメトリクス。
拡張メトリクスを有効にすると、次の追加ディメンションを使用できます。
| ディメンション | 説明 |
|---|---|
InstanceId |
特定のインスタンスの呼び出しメトリクスをフィルタリングします。 |
ContainerId |
(推論コンポーネントのみ) 特定のコンテナの呼び出しメトリクスをフィルタリングします。 |
コンテナレベルの使用率メトリクス
/aws/sagemaker/InferenceComponents 名前空間には、推論コンポーネントを使用するエンドポイントの使用率メトリクスが含まれます。拡張メトリクスを有効にすると、InstanceId、ContainerId、および AcceleratorId (GPU メトリクスのみ) ディメンションが既存の名前空間ディメンションとともに使用可能になります。メトリクスとディメンションの完全なリストについては、「」を参照してくださいSageMaker AI 推論コンポーネントのメトリクス。
拡張メトリクスを有効にすると、次の追加ディメンションを使用できます。
| ディメンション | 説明 |
|---|---|
InstanceId |
特定のインスタンスの使用率メトリクスをフィルタリングします。 |
ContainerId |
特定のコンテナの使用率メトリクスをフィルタリングします。 |
AcceleratorId |
(GPU メトリクスのみ) 特定の GPU の使用率メトリクスをフィルタリングします。 |
設定可能なメトリクスの頻度
メトリクスが CloudWatch に発行される間隔を設定できます。デフォルトの頻度は 60 秒です。
有効な値: 10、30、60、120、180、240、または 300 秒。
EnableEnhancedMetrics が に設定されている場合False、この頻度は使用率メトリクスにのみ適用されます。呼び出しメトリクスは引き続きデフォルトの 60 秒間隔で発行されます。に設定するとTrue、この頻度は使用率メトリクスと呼び出しメトリクスの両方に適用されます。
注記
60 秒未満の間隔 (高解像度) で発行されたメトリクスは、3 時間保持されます。
標準 CloudWatch 料金は、一意のディメンションの組み合わせごとにメトリクスごとに適用されます。拡張メトリクスは、各インスタンス、コンテナ、GPU が追加のディメンションの組み合わせを作成するため、メトリクスストリームの数を増やします。料金の詳細については、Amazon CloudWatch の料金
コード例: 拡張メトリクスの設定
次の例は、拡張メトリクスを有効にしてエンドポイント設定を作成する方法と、設定を検証する方法を示しています。