

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Ressourcen für die Kontingentverwaltung erstellen
<a name="create-quota-management-resources"></a>

Für die Kontingentverwaltung sind spezielle Einstellungen erforderlich, wenn eine zugehörige Planungsrichtlinie, eine Serviceumgebung und eine Auftragswarteschlange erstellt werden.

## Voraussetzungen
<a name="quota-management-resources-prerequisites"></a>

Bevor Sie Ressourcen für die Kontingentverwaltung erstellen, stellen Sie sicher, dass Sie über Folgendes verfügen:
+ **IAM-Berechtigungen — Berechtigungen** zum Erstellen und Verwalten von AWS Batch Jobwarteschlangen, Planungsrichtlinien und Serviceumgebungen. Weitere Informationen finden Sie unter [AWS Batch IAM-Richtlinien, -Rollen und -Berechtigungen](IAM_policies.md).

------
#### [ Configure quota management resources (AWS Batch console) ]

Die AWS Batch Konsole bietet einen integrierten Workflow für die Erstellung aller Ressourcen, die für die Kontingentverwaltung erforderlich sind. Der Workflow zur Erstellung von Auftragswarteschlangen zur Quotenverwaltung erstellt auch Planungsrichtlinien und Serviceumgebungen, die für die Quotenverwaltung aktiviert sind.

1. Öffnen Sie die AWS Batch Konsole unter [https://console.aws.amazon.com/batch/](https://console.aws.amazon.com/batch/).

1. Wählen Sie im Navigationsbereich **Job Queues** und dann **Create** aus.

1. **Wählen Sie als **Orchestrierungstyp** die Option Training ausSageMaker.**

1. Für die **Konfiguration der Job-Warteschlange**:

   1. Geben Sie unter **Name** den Namen der Job-Warteschlange ein.

   1. Geben Sie für **Priorität** einen Wert zwischen 0 und 1000 ein. Eine Auftragswarteschlange mit einer höheren Priorität wird für Serviceumgebungen bevorzugt.

1. Für die **Terminplanung**:

   1. Wählen Sie für den **Planungsalgorithmus** die Option **Kontingentverwaltung** aus.

   1. Für den **ARN für die Scheduling-Richtlinie**:
      + Wenn bereits eine Planungsrichtlinie existiert, die die Kontingentverwaltung spezifiziert, wählen Sie sie aus der Dropdownliste aus.
      + Wählen Sie andernfalls die Option **Planungsrichtlinie erstellen** aus.

        1. Eine Seitenleiste wird geöffnet, in der Sie die Planungsrichtlinie für die Kontingentverwaltung konfigurieren können.

        1. Geben Sie einen **Namen** für die Planungsrichtlinie ein.

        1. Wählen Sie **Erstellen** aus. Das **ARN-Feld für die Scheduling-Richtlinie** ist jetzt gefüllt.

1. Gehen Sie für die Konfiguration der **Serviceumgebung** unter **Verbundene Dienstumgebung** wie folgt vor:
**Anmerkung**  
Serviceumgebungen mit aktivierter Quotenverwaltung können nur mit einer einzigen Auftragswarteschlange mit aktivierter Quotenverwaltung verbunden werden.

   1. Wenn bereits eine Serviceumgebung erstellt wurde, die mit der Quotenverwaltung kompatibel ist und noch nicht mit einer Auftragswarteschlange verbunden ist, für die Quotenverwaltung aktiviert ist, wählen Sie sie aus der Dropdownliste aus.

   1. Andernfalls wählen Sie Serviceumgebung **erstellen** aus. Eine Seitenleiste wird geöffnet, um die Serviceumgebung zu konfigurieren.

      1. Geben Sie einen **Namen** für die Serviceumgebung ein.

      1. Geben Sie mindestens ein Kapazitätslimit an (und höchstens 5). Wählen Sie für jedes Kapazitätslimit einen **Instanztyp** aus der Dropdownliste und eine **maximale Anzahl von Instanzen** aus.

1. (Optional) Für **Grenzwerte für den Jobstatus**:

   1. Wählen Sie für **Fehlkonfiguration** eine der Optionen `SERVICE_ENVIRONMENT_MAX_RESOURCE` und geben Sie die **maximale Laufzeit (Sekunden**) ein.

   1. Wählen Sie für **Kapazität** die **maximale Laufzeit (Sekunden) `INSUFFICIENT_INSTANCE_CAPACITY` und geben Sie sie** ein.

1. Wählen Sie „**Job-Warteschlange erstellen**“.

------
#### [ Configure quota management resources (AWS CLI) ]

Um die Kontingentverwaltung über die AWS CLI zu konfigurieren, erstellen Sie eine Planungsrichtlinie, eine Serviceumgebung und eine Jobwarteschlange. Sowohl die Planungsrichtlinie als auch die Serviceumgebung müssen mit der Quotenverwaltung kompatibel sein und vor dem Erstellen der Jobwarteschlange erstellt werden.

**Erstellen Sie eine Planungsrichtlinie**

Verwenden Sie den `create-scheduling-policy` Befehl, um eine mit der Kontingentverwaltung kompatible Planungsrichtlinie zu erstellen. Geben Sie bei der Erstellung eine Richtlinie für die Quotenteilung an:

```
aws batch create-scheduling-policy \
  --name {{my-qm-sagemaker-scheduling-policy}} \
  --quota-share-policy idleResourceAssignmentStrategy="FIFO"
```

Stellen Sie sicher, dass die Planungsrichtlinie erfolgreich erstellt wurde:

```
aws batch describe-scheduling-policies \
  --arns {{arn-for-my-qm-sagemaker-scheduling-policy}}
```

**Erstellen Sie eine Serviceumgebung**

Verwenden Sie den `create-service-environment` Befehl, um eine Serviceumgebung mit aktivierter Quotenverwaltung zu erstellen. Stellen Sie sicher, dass für die Kapazitätsgrenzen Instanztypen verwendet werden, die von SageMaker Training Jobs akzeptiert werden, wie z. B. `ml.g6.xlarge` oder`ml.p4d.24xlarge`.

```
aws batch create-service-environment \
  --service-environment-name {{my-qm-sagemaker-service-env}} \
  --service-environment-type SAGEMAKER_TRAINING \
  --capacity-limits capacityUnit={{instance_type}},maxCapacity={{instance_count}}
```

Stellen Sie sicher, dass die Serviceumgebung erfolgreich erstellt wurde:

```
aws batch describe-service-environments \
  --service-environments {{my-qm-sagemaker-service-env}}
```

**Erstellen Sie eine Auftragswarteschlange**

Verwenden Sie den `create-job-queue` Befehl, um eine Auftragswarteschlange mit aktivierter Kontingentverwaltung zu erstellen. Die folgenden Kriterien müssen erfüllt sein:
+ Es muss eine einzige `SAGEMAKER_TRAINING` Dienstumgebung bereitgestellt werden, die derzeit nicht mit einer anderen Jobwarteschlange verbunden ist.
+ In der Serviceumgebung müssen Kapazitätsgrenzen in Form von Instanztypen ausgedrückt werden, wie z. B.`ml.m6i.xlarge`, und nicht`NUM_INSTANCES`.
+ Es muss eine Planungsrichtlinie angeschlossen werden, die eine enthält`quotaSharePolicy`.
+ Der `jobQueueType` muss `SAGEMAKER_TRAINING` sein.

```
aws batch create-job-queue \
  --job-queue-name {{my-qm-sagemaker-jq}} \
  --job-queue-type SAGEMAKER_TRAINING \
  --priority 1 \
  --service-environment-order order=1,serviceEnvironment={{my-qm-sagemaker-service-env}} \
  --scheduling-policy-arn {{arn-for-my-qm-sagemaker-scheduling-policy}}
```

Stellen Sie sicher, dass die Auftragswarteschlange erfolgreich erstellt wurde:

```
aws batch describe-job-queues \
  --job-queues {{my-qm-sagemaker-jq}}
```

Stellen Sie Folgendes sicher:
+ Das `state` ist `ENABLED`
+ Das `status` ist `VALID`
+ Das `statusReason` ist `JobQueue Healthy`

------