Verwenden von Amazon EC2 Capacity Blocks für ML mit AWS PCS - AWS PCS

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von Amazon EC2 Capacity Blocks für ML mit AWS PCS

Amazon EC2 Capacity Blocks for ML ist eine EC2 Kaufoption bei Amazon, mit der Sie im Voraus bezahlen können, um GPU-basierte Accelerated Computing-Instances innerhalb eines bestimmten Datums und Zeitbereichs zu reservieren, um Workloads mit kurzer Dauer zu unterstützen. Instances, die innerhalb eines Kapazitätsblocks ausgeführt werden, werden innerhalb von Amazon automatisch nahe beieinander platziert EC2 UltraClusters, um blockierungsfreie Netzwerke im Petabit-Bereich mit niedriger Latenz zu gewährleisten. Weitere Informationen finden Sie unter Capacity Blocks for ML im Amazon Elastic Compute Cloud-Benutzerhandbuch.

Sie können eine Startvorlage verwenden, damit AWS PCS beim Starten von Instances für eine Rechenknotengruppe einen Kapazitätsblock verwendet.

Anmerkung

AWS PCS unterstützt Capacity Blocks nur mit Slurm-Version 24.05 oder höher.

Einschränkungen

  • AWS PCS unterstützt nur Capacity Blocks mit den Instance-Familien P5en, P5e, P5 und P4d.

  • Sie können eine Rechenknotengruppe jeweils nur einem Kapazitätsblock zuordnen.

  • Sie können eine Rechenknotengruppe keiner Kapazitätsreservierungsgruppe zuordnen, die mehrere Kapazitätsblöcke kombiniert.

  • Kapazitätsblöcke müssen sich im active Status scheduled oder befinden, um sie mit AWS PCS verwenden zu können. Sie können Kapazitätsblöcke nicht in anderen Zuständen verwenden, z. payment-failed B. Weitere Informationen finden Sie unter Kapazitätsblöcke anzeigen im Amazon Elastic Compute Cloud-Benutzerhandbuch.

Ablauf des Kapazitätsblocks

Kapazitätsblöcke sind auf ein bestimmtes Datum und einen bestimmten Zeitraum beschränkt. Wenn ein Kapazitätsblock abläuft:

  • Die mit diesem Kapazitätsblock verknüpfte Rechenknotengruppe ist weiterhin vorhanden und bleibt denselben Warteschlangen zugeordnet.

  • Alle Instanzen in der Compute-Knotengruppe sind beendet und aktive Jobs können je nach Ihren Slurm-Einstellungen fehlschlagen.

  • AWS PCS kann keine neuen Instanzen in der Compute-Knotengruppe starten.

  • Alle in der Warteschlange befindlichen oder neu eingereichten Jobs verbleiben im Status „Ausstehend“, bis eine weitere Rechenknotengruppe an die Warteschlange angehängt wird oder Sie die Compute-Knotengruppe so aktualisieren, dass sie eine neue Startvorlage verwendet, die einen neuen Kapazitätsblock angibt.