インタラクティブエンドポイントのモニタリング
EKS での Amazon EMR 6.10 以降では、インタラクティブエンドポイントは、カーネルのライフサイクルオペレーションのモニタリングとトラブルシューティングのための Amazon CloudWatch メトリクスを生成します。メトリクスは、EMR Studio やセルフホストの Jupyter Notebook などのインタラクティブクライアントによってトリガーされます。インタラクティブエンドポイントがサポートする各操作には、メトリクスが関連付けられています。以下の表に示すように、操作は各メトリクスのディメンションとしてモデル化されます。インタラクティブエンドポイントによって生成されたメトリクスは、アカウントのカスタム名前空間 EMRContainers に表示されます。
| メトリクス | 説明 | 単位 |
|---|---|---|
|
RequestCount |
インタラクティブエンドポイントによって処理されたオペレーションのリクエストの累積数。 |
カウント |
|
RequestLatency |
リクエストがインタラクティブエンドポイントに到着し、インタラクティブエンドポイントからレスポンスが送信されるまでの時間。 |
ミリ秒 |
|
4XXError |
操作のリクエストが処理中に 4xx エラーになった場合に生成されます。 |
カウント |
|
5XXError |
操作のリクエストが 5Xxx サーバー側エラーになった場合に生成されます。 |
カウント |
|
KernelLaunchSuccess |
CreateKernel 操作にのみ適用されます。このリクエストを含む、このリクエストまでに成功したカーネル起動の累積数を示します。 |
カウント |
|
KernelLaunchFailure |
CreateKernel 操作にのみ適用されます。このリクエストを含む、このリクエストまでに失敗したカーネル起動の累積数を示します。 |
カウント |
各インタラクティブエンドポイントメトリクスには、次のディメンションが関連付けられています。
-
ManagedEndpointId—インタラクティブエンドポイントの識別子 -
OperationName—インタラクティブクライアントによってトリガーされる操作
OperationName ディメンションに指定できる値を次の表に示します。
operationName |
操作の説明 |
|---|---|
|
|
インタラクティブエンドポイントにカーネルの起動をリクエストします。 |
|
|
インタラクティブエンドポイントに、同じセッショントークンを使用して以前に起動されたカーネルを一覧表示するようにリクエストします。 |
|
|
インタラクティブエンドポイントに、以前に起動された特定のカーネルの詳細を取得するようにリクエストします。 |
|
|
インタラクティブエンドポイントに、ノートブッククライアントとカーネル間の接続を確立するようにリクエストします。 |
|
|
pyspark カーネルで |
|
|
インタラクティブエンドポイントに、利用可能なカーネル仕様を一覧表示するようリクエストします。 |
|
|
インタラクティブエンドポイントに、以前に起動したカーネルのカーネル仕様を取得するようリクエストします。 |
|
|
インタラクティブエンドポイントに、以前に起動されたカーネル仕様に関連する特定のリソースを取得するようにリクエストします。 |
例
特定の日にインタラクティブエンドポイントで起動されたカーネルの総数を確認するには
-
カスタム名前空間を選択します:
EMRContainers -
ManagedEndpointId、OperationName – CreateKernelを選択します。 -
統計
SUMと期間1 dayを含むRequestCountメトリクスは、過去 24 時間以内に行われたすべてのカーネル起動リクエストを提供します。 -
統計
SUMと期間1 dayを含む KernelLaunchSuccess メトリクスは、過去 24 時間以内に行われたすべての成功したカーネル起動リクエストを提供します。
特定の日にインタラクティブエンドポイントで発生したカーネル障害の数を確認するには
-
カスタム名前空間を選択します: EMRContainers
-
ManagedEndpointId、OperationName – CreateKernelを選択します。 -
統計
SUMと期間1 dayを含むKernelLaunchFailureメトリクスは、過去 24 時間以内に行われたすべての失敗したカーネル起動リクエストを提供します。また、4XXErrorと5XXErrorメトリクスを選択して、どのようなカーネル起動エラーが発生したかを確認することもできます。