

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# クラスターメトリクス用の Amazon CloudWatch アラーム
<a name="cloudwatch-alarms-v3"></a>

AWS ParallelCluster は、ヘッドノードのヘルスとリソース使用率をモニタリングするように Amazon CloudWatch アラームを設定します。アラームの名前は です。ここで`cluster-name-HeadNode-metric`、*cluster-name* はクラスターの名前であり、*メトリクス*はモニタリング対象のメトリクスを識別します。

ナビゲーションペインで **[アラーム]** を選択して、CloudWatch コンソールのアラームにアクセスします。

という名前の複合アラームは、個々のヘッドノードアラームのいずれかがトリガーされると `ALARM`状態`cluster-name-HeadNode`になります。

## ディスクとメモリのアラーム
<a name="cloudwatch-alarms-v3-disk-mem"></a>

 AWS ParallelCluster バージョン 3.6.0 以降では、次の CloudWatch アラームが作成されます。
+ `cluster-name-HeadNode-Disk` — ルートボリューム`disk_used_percent`メトリクスをモニタリングします。1 分間に 1 つのデータポイントでディスク使用量が 90% を超える場合`ALARM`の状態を入力します。
+ `cluster-name-HeadNode-Mem` — `mem_used_percent`メトリクスをモニタリングします。1 分間に 1 つのデータポイントでメモリ使用量が 90% を超える場合`ALARM`の状態を入力します。

詳細については、「*Amazon CloudWatch ユーザーガイド*」の「[CloudWatch エージェントにより収集されるメトリクス](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/metrics-collected-by-CloudWatch-agent.html)」を参照してください。

## ヘルスチェックと CPU アラーム
<a name="cloudwatch-alarms-v3-health-cpu"></a>

 AWS ParallelCluster バージョン 3.8.0 以降では、次の CloudWatch アラームが作成されます。
+ `cluster-name-HeadNode-Health` — Amazon EC2 `StatusCheckFailed`メトリクスをモニタリングします。1 分間に 1 つのデータポイントで値が 0 より大きい場合`ALARM`の状態を入力します。
+ `cluster-name-HeadNode-Cpu` — Amazon EC2 `CPUUtilization`メトリクスをモニタリングします。1 分間に 1 つのデータポイントで CPU 使用率が 90% を超える場合`ALARM`の状態を入力します。

## クラスター管理デーモンハートビートアラーム
<a name="cloudwatch-alarms-v3-clustermgtd"></a>

 AWS ParallelCluster バージョン 3.15.0 以降では、Amazon CloudWatch ログ記録が有効で、スSlurmケジューラが使用されている場合、次のアラームが作成されます。
+ `cluster-name-HeadNode-ClustermgtdHeartbeat` — `ParallelCluster`名前空間の `ClustermgtdHeartbeat`メトリクスをモニタリングします。アラームは、1 分間に 10 個の連続したデータポイントに対して 1 ハートビート未満を受信すると、 `ALARM`状態になります。欠落データは違反として扱われます。

**注記**  
すべてのアラームは対称的に復旧します。アラームをトリガーするのと同じデータポイントと評価期間も復旧を管理します。たとえば、1 つのデータポイントを持つアラームは、同じ観測期間内に 1 つの正常なデータポイントの後に回復します。同様に、`ClustermgtdHeartbeat`アラームは に戻るために 10 個の正常なデータポイント (10 分) が連続して必要です`OK`。

**注記**  
AWS ParallelCluster はアラームアクションを設定しません。通知の送信など、アラームアクションの設定方法については、「[アラームアクション](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html#alarms-and-actions)」を参照してください。Amazon CloudWatch アラームの使用の詳細については、「Amazon CloudWatch ユーザーガイド**」の「[Amazon CloudWatch アラームの使用](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)」を参照してください。  
 AWS ParallelCluster バージョン 3.8.0 以降では、クラスター設定`false`で [`Monitoring`](Monitoring-v3.md) // [`Alarms`](Monitoring-v3.md#yaml-Monitoring-Alarms) [`Enabled`](Monitoring-v3.md#yaml-Monitoring-Alarms-Enabled)を に設定してアラームを無効にします。  
3.8.0 より前の AWS ParallelCluster バージョンでは、クラスター設定`false`で [`Monitoring`](Monitoring-v3.md) /[`Dashboards`](Monitoring-v3.md#yaml-Monitoring-Dashboards)/// [`CloudWatch`](Monitoring-v3.md#yaml-Monitoring-Dashboard-CloudWatch) [`Enabled`](Monitoring-v3.md#yaml-Monitoring-Dashboard-CloudWatch-Enabled)を に設定してアラームを無効にします。この設定により、Amazon CloudWatch ダッシュボードも無効になることに注意してください。詳細については[Amazon CloudWatch ダッシュボード](cloudwatch-dashboard-v3.md)、「」を参照してください。