クラスター更新の利点サポートされている設定の変更制限クラスター更新の前提条件プロセスとジョブの影響を更新する更新中の請求

PCS AWS でのクラスターの更新

AWS PCS では、UpdateCluster API またはコンソールを使用して、作成後にクラスター設定を更新できます。インフラストラクチャを再構築することなくクラスター設定を変更できるため、運用上のオーバーヘッドが軽減され、中断が最小限に抑えられます。

クラスター更新の利点

PCS AWS クラスターを更新すると、サービスを中断することなく、HPC インフラストラクチャを新しい要件に適応させることができます。設定の変更には、クラスターの再構築に 1 時間以上かかるのではなく、数分かかります。この機能は、最小限のダウンタイムを必要とする本番環境や、ワークロードパターンの変化に応じてクラスター設定を調整する必要があるチームにとって重要です。

サポートされている設定の変更

設定の 3 つの主要なカテゴリを変更できます。

アカウンティング設定 - マネージドアカウンティングを有効または無効にし、保持設定を構成します。
スケールダウン動作 - scaleDownIdleTimeパラメータを調整します。これにより、PCS AWS が自動的にインスタンスを終了するまで、動的インスタンスがアイドル状態のままになる時間を制御します。
Slurm カスタム設定 - Prolog、Epilog、SelectTypeParameters など、クラスターレベルで適用されるサポートされている Slurm 設定を変更します。

制限

クラスターの作成後に特定の設定を変更することはできません。具体的には次のとおりです。

セキュリティグループ設定
VPC サブネットの選択
クラスターサイズ
Slurm バージョン
クラスター名

これらの設定はクラスターのアーキテクチャの基礎であり、変更するには新しいクラスターを作成する必要があります。

クラスター更新の前提条件

クラスターを更新する前に、次の条件が満たされていることを確認してください。

クラスターは ACTIVE、UPDATE_FAILED、または SUSPENDED状態である必要があります
関連するすべてのリソース (キュー、コンピューティングノードグループ) は ACTIVE状態である必要があります
UpdateCluster オペレーションには適切な IAM アクセス許可が必要です
他の更新オペレーションは進行中にできません

プロセスとジョブの影響を更新する

更新オペレーション中、クラスターコントローラーが一時的に到達不能になっても、コンピューティングノードは既存のジョブを引き続き実行します。ただし、この期間中、システムは新しいジョブの送信を受け入れたり、スケジュールを決定したりすることはできません。

コンソールと API インターフェイスの両方でクラスターの更新をモニタリングできます。クラスターは、更新中に次の状態に移行します。

UPDATING - 更新中
ACTIVE - 更新が正常に完了しました
UPDATE_FAILED - 更新でエラーが発生しました

更新中の請求

PCS AWS クラスターの標準時間単位の料金は、更新オペレーション中も継続されます。アカウンティングを無効にするようにクラスターを更新すると、アカウンティング機能の請求は、クラスターが UPDATING状態になるとすぐに停止します。アカウンティングを有効にすると、クラスターが正常に更新を完了して ACTIVE状態に戻るまで、請求は開始されません。

トピック

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

クラスターの作成

クラスターの更新