Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Capacity BlocksFür Machine-Learning-Workloads verwenden
Capacity Blockshelfen Ihnen dabei, stark nachgefragte GPU-Instances zu einem future Zeitpunkt zu reservieren, um Ihre kurzfristigen Machine-Learning-Workloads (ML) zu unterstützen.
Einen Überblick über Capacity Blocks und wie sie funktionieren, finden Sie unter Capacity Blocksfür ML im Amazon EC2 EC2-Benutzerhandbuch.
Um mit der Nutzung zu beginnenCapacity Blocks, erstellen Sie eine Kapazitätsreservierung in einer bestimmten Availability Zone. Capacity Blockswerden als targeted Kapazitätsreservierungen in einer einzigen Availability Zone bereitgestellt. Wenn Sie Ihre Startvorlage erstellen, geben Sie die Reservierungs-ID und den Instanztyp des Kapazitätsblocks an. Aktualisieren Sie dann Ihre Auto Scaling Scaling-Gruppe so, dass sie die von Ihnen erstellte Startvorlage und die Availability Zone des Capacity Blocks verwendet. Wenn Ihre Capacity Block-Reservierung beginnt, verwenden Sie die geplante Skalierung, um dieselbe Anzahl von Instances wie Ihre Capacity Block-Reservierung zu starten.
Wichtig
Capacity Blockssind nur für bestimmte Amazon EC2 EC2-Instance-Typen und AWS-Regionen verfügbar. Weitere Informationen finden Sie unter Voraussetzungen im Amazon EC2 EC2-Benutzerhandbuch.
Inhalt
Betriebliche Richtlinien
Nachfolgend finden Sie grundlegende Richtlinien, die Sie bei der Verwendung eines Kapazitätsblocks mit einer Auto-Scaling-Gruppe beachten sollten.
-
Skalieren Sie Ihre Auto-Scaling-Gruppe mehr als 30 Minuten vor der Endzeit der Kapazitätsblockreservierung auf Null herunter. Amazon EC2 beendet alle Instances, die noch in Betrieb sind, 30 Minuten vor dem Ende des Kapazitätsblocks.
-
Wir empfehlen Ihnen, die geplante Skalierung zu verwenden, um zu den entsprechenden Reservierungszeiten die horizontale Skalierung (Hinzufügen von Instances) und die Skalierung (Instances entfernen) durchzuführen. Weitere Informationen finden Sie unter Geplante Skalierung für Amazon EC2 Auto Scaling.
-
Fügen Sie bei Bedarf Lebenszyklus-Hooks hinzu, um Ihre Anwendung beim Skalieren innerhalb der Instances ordnungsgemäß herunterzufahren. Lassen Sie genügend Zeit, bis die Lebenszyklus-Aktion abgeschlossen ist, bevor Amazon EC2 beginnt, Ihre Instances 30 Minuten vor dem Ende der Kapazitätsblockreservierung zwangsweise zu beenden. Weitere Informationen finden Sie unter Lebenszyklus-Hooks bei Amazon EC2 Auto Scaling.
-
Stellen Sie sicher, dass die Auto-Scaling-Gruppe für die gesamte Dauer der Reservierung auf die richtige Version der Startvorlage verweist. Wir empfehlen, auf eine bestimmte Version der Startvorlage statt auf die Version
$Defaultoder$Latestzu verweisen.
Anmerkung
Wenn Sie eine Capacity Block-Instance bis zum Ende der Reservierung laufen lassen und Amazon EC2 sie zurückfordert, geben die Skalierungsaktivitäten für Ihre Auto Scaling Scaling-Gruppe an, dass sie "taken out of service in
response to an EC2 health check that indicated it had been
terminated or stopped„war, obwohl sie am Ende des Kapazitätsblocks absichtlich zurückgefordert wurde. In ähnlicher Weise versucht Amazon EC2 Auto Scaling, die Instance auf dieselbe Weise zu ersetzen, wie es bei jeder Instance der Fall ist, die eine Zustandsprüfung nicht besteht. Weitere Informationen finden Sie unter Zustandsprüfungen für Instances in einer Auto-Scaling-Gruppe.
Geben Sie in Ihrer Startvorlage einen Kapazitätsblock an
Verwenden Sie eine der folgenden Methoden, um eine Startvorlage zu erstellen, die auf einen bestimmten Kapazitätsblock für Ihre Auto Scaling Scaling-Gruppe abzielt:
Einschränkungen
-
Support für Capacity Blocks ist nur verfügbar, wenn Ihre Auto Scaling Scaling-Gruppe über eine kompatible Konfiguration verfügt. Gruppen mit gemischten Instances und warmen Pools werden nicht unterstützt.
-
Sie können jeweils nur einen Kapazitätsblock als Ziel angeben.
Zugehörige Ressourcen
-
Die Voraussetzungen und Empfehlungen für die Verwendung von P5-Instances finden Sie unter Erste Schritte mit P5-Instances im Amazon EC2 EC2-Benutzerhandbuch.
-
Amazon EKS unterstützt die Verwendung Capacity Blocks zur Unterstützung Ihrer kurzfristigen Workloads für maschinelles Lernen (ML) auf Amazon EKS-Clustern. Weitere Informationen finden Sie unter Capacity Blocksfür ML im Amazon EKS-Benutzerhandbuch.
-
Sie können es Capacity Blocks mit unterstützten Instance-Typen und Regionen verwenden. Kapazitätsreservierungen auf Abruf bieten jedoch die Flexibilität, Kapazität für andere Instance-Typen und Regionen zu reservieren. Ein Tutorial, das Ihnen zeigt, wie Sie die Option On-Demand-Kapazitätsreservierung verwenden, finden Sie unterReservieren Sie Kapazität in bestimmten Availability Zones mit Kapazitätsreservierungen.