Unterstützte Instance-Typen und Regionen Unterstützte Plattformen Überlegungen Zugehörige Ressourcen

Kapazitätsblöcke für ML

Mit Kapazitätsblöcken für ML können Sie GPU-based Accelerated Computing-Instances zu einem future Zeitpunkt reservieren, um Ihre kurzfristigen Machine-Learning-Workloads (ML) zu unterstützen. Instances, die innerhalb eines Kapazitätsblocks ausgeführt werden, werden in Amazon EC2 automatisch nahe beieinander platziert UltraClusters, um blockierungsfreie Netzwerke im Petabit-Bereich mit niedriger Latenz zu gewährleisten.

Sie können Capacity Blocks auch verwenden, um Kapazität für Amazon EC2 UltraServers zu reservieren. UltraServers verbinden Sie mehrere Amazon EC2 EC2-Instances innerhalb einer Accelerator-Verbindung mit niedriger Latenz und hoher Bandbreite. Sie können UltraServers damit die rechen- und speicherintensivsten AI/ML Workloads in den Bereichen Training, Feinabstimmung und Inferenz bewältigen. Weitere Informationen finden Sie unter Amazon EC2 UltraServers.

Mit Kapazitätsblöcken können Sie sehen, wann GPU-Instance-Kapazität an zukünftigen Terminen verfügbar ist, und Sie können einen Kapazitätsblock so planen, dass er zu einem Zeitpunkt startet, der für Sie am besten passt. Wenn Sie einen Kapazitätsblock reservieren, erhalten Sie eine vorhersehbare Kapazitätsgarantie für GPU-Instance und zahlen nur für die Zeit, die Sie benötigen. Wir empfehlen Kapazitätsblöcke, wenn Sie für Ihre ML-Workloads tage- oder wochenlang GPUs benötigen und nicht für eine Reservierung zahlen möchten, während Ihre GPU-Instances nicht verwendet werden.

Im Folgenden sind einige häufige Anwendungsfälle für Kapazitätsblöcke aufgeführt.

Modell-Training und Feinabstimmung für Machine Learning (ML) – Erhalten Sie ununterbrochenen Zugriff auf die GPU-Instances, die Sie für die Durchführung des ML-Modell-Trainings und der Feinabstimmung reserviert haben.
ML-Experimente und Prototypen – Führen Sie Experimente durch und erstellen Sie Prototypen, die kurzfristig GPU-Instances erfordern.

Kapazitätsblöcke sind in einigen Regionen für ausgewählte Instance-Typen verfügbar. AWS Weitere Informationen finden Sie unter Unterstützte Instance-Typen und Regionen.

Sie können einen Kapazitätsblock mit einem Reservierungsstartzeitpunkt bis zu acht Wochen in der Zukunft reservieren. Jeder Kapazitätsblock kann bis zu 64 Instances haben, und Sie können bis zu 256 Instances in mehreren Kapazitätsblöcken haben.

Themen

Unterstützte Instance-Typen und Regionen

Instance- und UltraServer Capacity-Blöcke können mit den folgenden Instance-Typen und AWS Regionen verwendet werden.

Anmerkung

Kapazitätsblockgrößen von 64 Instances werden nicht für alle Instance-Typen in allen AWS-Regionen unterstützt.

Instanz-Kapazitätsblöcke

Instance-Typ	USA Ost (Nord-Virginia) us-east-1	USA Ost (Ohio) – us-east-2	USA West (Nordkalifornien) us-west-1	USA West (Oregon) us-west-2	Europa (Stockholm) eu-north-1	Europa (London) eu-west-2	Europa (Spanien) eu-south-2	Asien-Pazifik (Tokio) ap-northeast-1	Asien-Pazifik (Seoul) – ap-northeast-2	Asien-Pazifik (Mumbai) – ap-south-1	Asien-Pazifik (Sydney) ap-southeast-2	Asien-Pazifik (Jakarta) ap-southeast-3	Asien-Pazifik (Melbourne) ap-southeast-4	Südamerika (São Paulo) – sa-east-1	AWS GovCloud () US-Regierung Ost-1 US-East	AWS GovCloud (US-West) US-Regierung West-1	USA Ost (Atlanta) us-east-1-atl-2a	Vereinigte Staaten West (Phoenix) us-west-2-phx-2a
`p6-b300.48xlarge`	✓			✓											✓		✓
`p6-b200.48xlarge`	✓	✓		✓						✓					✓	✓
`p5.4xlarge`	✓	✓		✓		✓		✓		✓	✓			✓
`p5.48xlarge`	✓	✓	✓	✓	✓	✓		✓		✓	✓	✓		✓			✓
`p5e.48xlarge`	✓	✓	✓	✓	✓	✓		✓		✓	✓	✓		✓				✓
`p5en.48xlarge`	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓
`p4d.24xlarge`	✓	✓		✓
`p4de.24xlarge`	✓			✓
`trn1.32xlarge`	✓	✓		✓	✓					✓	✓		✓
`trn2.3xlarge`													✓	✓
`trn2.48xlarge`		✓

UltraServer Kapazitätsblöcke

Instance-Typ	USA Ost (Ohio) – us-east-2	USA Ost (Dallas) us-east-1-dfw-2a
`Trn2`	✓
`P6e-GB200`		✓

Unterstützte Plattformen

Capacity Blocks für ML unterstützen derzeit nur Instances und UltraServers zwar nur mit Standard-Tenancy. Wenn Sie den AWS-Managementkonsole zum Kauf eines Capacity Blocks verwenden, ist Linux/UNIX die Standard-Plattformoption. Wenn Sie das AWS Command Line Interface (AWS CLI) oder verwenden AWS SDK, um einen Capacity-Block zu kaufen, sind die folgenden Plattformoptionen verfügbar:

Linux/Unix
Red Hat Enterprise Linux
RHEL mit HA
SUSE Linux
Ubuntu Pro

Überlegungen

Berücksichtigen Sie vor der Verwendung von Kapazitätsblöcken die folgenden Details und Einschränkungen.

Wenn wir eine Beeinträchtigung feststellen, die sich auf einen UltraServer Kapazitätsblock auswirkt, werden wir Sie benachrichtigen, aber im Allgemeinen werden wir keine Maßnahmen ergreifen, um Ihre Instances auf dem Kapazitätsblock zu beenden. Dies dient dazu, unbeabsichtigte Unterbrechungen Ihrer Workloads zu minimieren. Nach Erhalt dieser Benachrichtigung können Sie den UltraServer Kapazitätsblock unverändert weiter verwenden oder eine Behebung beantragen, indem Sie alle Instances auf dem Kapazitätsblock beenden und eine AWS Support-Anfrage einreichen. Nachdem wir Ihre Support-Anfrage erhalten haben, werden wir Sie benachrichtigen, sobald wir die Behebung abgeschlossen haben und Sie Instances auf Ihrem Capacity Block neu starten können. UltraServer
Bei P6e-GB200 UltraServer Kapazitätsblöcken müssen Sie Ihre Instances mindestens 60 Minuten vor dem Ende des Kapazitätsblocks beenden.
Um Kapazitätsblöcke in Local Zones kaufen und verwenden zu können, müssen Sie für die lokale Zone angemeldet sein.
Jeder Kapazitätsblock kann bis zu 64 Instances haben, und Sie können bis zu 256 Instances in mehreren Kapazitätsblöcken haben.
Sie können Kapazitätsblockangebote beschreiben, die bereits in 30 Minuten beginnen können.
Kapazitätsblöcke beginnen und enden um 11:30 Uhr koordinierte Weltzeit (UTC).
Der Beendigungsprozess für Instances, die in einem Kapazitätsblock ausgeführt werden, beginnt um 11:00 Uhr koordinierter Weltzeit (UTC) am letzten Tag der Reservierung.
Kapazitätsblöcke können mit einer Startzeit bis zu 8 Wochen in der Zukunft reserviert werden.
Stornierungen von Kapazitätsblöcken sind nicht zulässig.
UltraServer Kapazitätsblöcke können nicht zwischen AWS Konten oder innerhalb Ihrer AWS Organisation gemeinsam genutzt werden.
Ein Kapazitätsblock kann nicht verschoben oder aufgeteilt werden.
Nur UltraServer Kapazitätsblöcke können mit Ressourcengruppen verwendet werden. Instance-Kapazitätsblöcke können nicht mit Ressourcengruppen verwendet werden. Weitere Informationen finden Sie unter Erstellen Sie eine Ressourcengruppe für UltraServer Kapazitätsblöcke.
Die Gesamtzahl der Instanzen, die in Kapazitätsblöcken für alle Konten in Ihrer AWS Organisation reserviert werden können, darf an einem bestimmten Datum 256 Instanzen nicht überschreiten.
Um einen Kapazitätsblock zu verwenden, müssen Instances gezielt die Reservierungs-ID verwenden.
Instances in einem Kapazitätsblock werden nicht auf Ihre On-Demand Instance-Limits angerechnet.
Stellen Sie für P5-Instances, die ein benutzerdefiniertes AMI verwenden, sicher, dass Sie über die erforderliche Software und Konfiguration für EFA verfügen.
Informationen zu verwalteten Amazon-EKS-Knotengruppen finden Sie unter Erstellen einer verwalteten Knotengruppe mit Amazon EC2 Capacity Blocks für ML. Informationen zu selbstverwalteten Amazon-EKS-Knotengruppen finden Sie unter Verwenden von Kapazitätsblöcken für ML mit selbstverwalteten Knoten.

Nachdem Sie einen Kapazitätsblock erstellt haben, können Sie mit dem Kapazitätsblock Folgendes tun:

Starten Sie Instances im Kapazitätsblock. Weitere Informationen finden Sie unter Instances mit Kapazitätsblöcken starten.
Erstellen Sie eine Gruppe für Amazon EC2 Auto Scaling. Weitere Informationen finden Sie unter Verwenden von Kapazitätsblöcken für Machine Learning im Benutzerhandbuch für Amazon EC2 Auto Scaling.

Anmerkung
Wenn Sie Amazon EC2 Auto Scaling oder Amazon EKS verwenden, können Sie die Skalierung so planen, dass sie zu Beginn der Kapazitätsblockreservierung ausgeführt wird. Bei der geplanten Skalierung werden Wiederholungsversuche AWS automatisch für Sie erledigt, sodass Sie sich keine Gedanken über die Implementierung der Wiederholungslogik für vorübergehende Ausfälle machen müssen.
Verbessern Sie ML-Workflows mit AWS Parallel Computing Service. Weitere Informationen finden Sie unter Unterstützung von Kapazitätsblöcken für AWS Parallel Computing Service.
Verbessern Sie ML-Workflows mit AWS ParallelCluster. Weitere Informationen finden Sie unter Verbesserung von ML-Workflows mit AWS ParallelCluster und Amazon EC2 Capacity Blocks for ML.

Weitere Informationen zu AWS Parallel Computing Service finden Sie unter Was ist AWS Parallel Computing Service.

Weitere Informationen zu AWS ParallelCluster finden Sie unter Was ist AWS ParallelCluster.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Überwachen Sie mit und EventBridge CloudTrail

Funktionsweise