PCS で ML に Amazon EC2 AWS キャパシティブロックを使用する - AWS PCS

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

PCS で ML に Amazon EC2 AWS キャパシティブロックを使用する

Amazon EC2 Capacity Blocks for ML は、短期間のワークロードをサポートするために、特定の日時範囲内で GPU ベースの高速コンピューティングインスタンスを事前に予約するための Amazon EC2 購入オプションです。キャパシティブロック内で実行されるインスタンスは、「Amazon EC2 UltraClusters」内に自動的に互いに近く配置され、低レイテンシーでペタビットスケールのノンブロッキングネットワーキングを実現します。詳細については、「Amazon Elastic Compute Cloud ユーザーガイド」の「ML のキャパシティブロック」を参照してください。

起動テンプレートを使用して、コンピューティングノードグループのインスタンスを起動するときに PCS AWS にキャパシティブロックを使用させることができます。

注記

AWS PCS は、Slurm バージョン 24.05 以降のキャパシティブロックのみをサポートします。

制限

  • AWS PCS は、P5en, P5e, P5P4d インスタンスファミリーのキャパシティブロックのみをサポートします。

  • コンピューティングノードグループは、一度に 1 つのキャパシティブロックにのみ関連付けることができます。

  • コンピューティングノードグループを、複数のキャパシティブロックを組み合わせたキャパシティ予約グループに関連付けることはできません。

  • PCS で使用するキャパシティブロックは、 scheduledまたは AWS active状態である必要があります。などの他の状態でキャパシティブロックを使用することはできませんpayment-failed。詳細については、「Amazon Elastic Compute Cloud ユーザーガイド」の「キャパシティブロックの表示」を参照してください。

キャパシティブロックの有効期限

キャパシティブロックは、特定の日付と時刻の範囲に制限されます。キャパシティブロックの有効期限が切れた場合:

  • そのキャパシティブロックに関連付けられたコンピューティングノードグループは引き続き存在し、同じキューに関連付けられます。

  • コンピューティングノードグループ内のすべてのインスタンスが終了し、Slurm 設定に基づいてアクティブなジョブが失敗する可能性があります。

  • AWS PCS はコンピューティングノードグループで新しいインスタンスを起動できません。

  • キューに入れられたジョブまたは新しく送信されたジョブはすべて、別のコンピューティングノードグループがキューにアタッチされるか、新しいキャパシティブロックを指定する新しい起動テンプレートを使用するようにコンピューティングノードグループを更新するまで、保留中の状態のままになります。