In was sind Serviceumgebungen AWS Batch - AWS Batch

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

In was sind Serviceumgebungen AWS Batch

Eine Serviceumgebung ist eine AWS Batch Ressource, die die Konfigurationsparameter enthält, die für die Integration AWS Batch mit SageMaker KI erforderlich sind. Serviceumgebungen AWS Batch ermöglichen die Einreichung und Verwaltung von SageMaker Schulungsaufträgen und bieten AWS Batch gleichzeitig Funktionen zur Warteschleifenverwaltung, Terminplanung und Prioritätsverwaltung.

Serviceumgebungen befassen sich mit allgemeinen Herausforderungen, mit denen Data-Science-Teams bei der Verwaltung von Workloads für maschinelles Lernen konfrontiert sind. Organizations beschränken häufig die Anzahl der für Trainingsmodelle verfügbaren Instanzen, um versehentliche Mehrausgaben zu vermeiden, Budgetbeschränkungen einzuhalten, Kosten mit Reserved Instances zu sparen oder bestimmte Instance-Typen für Workloads zu verwenden. Datenwissenschaftler möchten jedoch möglicherweise mehr Workloads gleichzeitig ausführen, als dies mit den ihnen zugewiesenen Instanzen möglich ist, sodass eine manuelle Koordination erforderlich ist, um zu entscheiden, welche Workloads wann ausgeführt werden.

Diese Koordinationsherausforderung wirkt sich auf Unternehmen jeder Größe aus, von Teams mit nur wenigen Datenwissenschaftlern bis hin zu großen Unternehmen. Mit dem Wachstum von Unternehmen nimmt die Komplexität zu, was mehr Zeit für die Verwaltung der Workload-Koordination erfordert und häufig die Einbindung von Infrastrukturadministratoren erforderlich macht. Dieser manuelle Aufwand vergeudet Zeit und verringert die Effizienz der Instanzen, was zu realen Kosten für die Kunden führt.

In Serviceumgebungen können Datenwissenschaftler und ML-Techniker SageMaker Schulungsaufträge mit Prioritäten in konfigurierbare Warteschlangen eintragen und so sicherstellen, dass Workloads automatisch und ohne Eingreifen ausgeführt werden, sobald Ressourcen verfügbar sind. Diese Integration nutzt AWS Batch die umfangreichen Warteschlangen- und Planungsfunktionen, sodass Kunden ihre Warteschlangen- und Planungsrichtlinien an die Ziele ihres Unternehmens anpassen können.

Wie Serviceumgebungen mit anderen Komponenten zusammenarbeiten AWS Batch

Serviceumgebungen lassen sich in andere AWS Batch Komponenten integrieren, um die Warteschlange für SageMaker Trainingsaufgaben zu ermöglichen:

  • Jobwarteschlangen — Serviceumgebungen sind mit Jobwarteschlangen verknüpft, damit die Warteschlange Serviceaufträge für SageMaker Trainingsjobs verarbeiten kann

  • Serviceaufträge — Wenn Sie einen Serviceauftrag an eine Warteschlange weiterleiten, die mit einer Serviceumgebung verknüpft ist, AWS Batch verwendet die Konfiguration der Umgebung, um den entsprechenden SageMaker Schulungsjob weiterzuleiten

  • Planungsrichtlinien — Serviceumgebungen arbeiten mit AWS Batch Planungsrichtlinien, um die Reihenfolge der Ausführung von SageMaker Schulungsaufträgen zu priorisieren und zu verwalten

Diese Integration ermöglicht es Ihnen, die ausgereiften Warteschlangen- und Planungsfunktionen zu nutzen AWS Batch und gleichzeitig die volle Funktionalität und Flexibilität von SageMaker Schulungsaufträgen beizubehalten.

Bewährte Methoden für Serviceumgebungen

Serviceumgebungen bieten Funktionen für die Verwaltung von SageMaker Schulungsaufträgen in großem Umfang. Die Einhaltung dieser bewährten Methoden hilft Ihnen, Kosten, Leistung und betriebliche Effizienz zu optimieren und gleichzeitig häufig auftretende Konfigurationsprobleme zu vermeiden, die sich auf Ihre Workflows für maschinelles Lernen auswirken können.

Beachten Sie bei der Planung der Kapazität der Serviceumgebung die spezifischen Kontingente und Grenzwerte, die für die Warteschlange von SageMaker Schulungsaufträgen gelten. Jede Serviceumgebung hat eine maximale Kapazitätsgrenze, die in der Anzahl der Instanzen ausgedrückt wird. Dadurch wird direkt gesteuert, wie viele SageMaker Trainingsjobs gleichzeitig ausgeführt werden können. Wenn Sie diese Grenzwerte kennen, können Sie Ressourcenengpässen vorbeugen und vorhersehbare Ausführungszeiten für Aufgaben sicherstellen.

Eine optimale Leistung der Serviceumgebung hängt davon ab, dass Sie die einzigartigen Merkmale der Planung von SageMaker Schulungsaufgaben verstehen. Im Gegensatz zu herkömmlichen Jobs in Containern werden Jobs im Dienstleistungssektor von einem bestimmten SCHEDULED Staat abgewickelt, während SageMaker KI die erforderlichen Schulungsinstanzen beschafft und bereitstellt. Das bedeutet, dass die Startzeiten von Jobs je nach Verfügbarkeit der Instanzen und regionalen Kapazitäten erheblich variieren können.

Wichtig

Serviceumgebungen haben spezifische Kontingente, die sich auf Ihre Fähigkeit auswirken können, die Workloads für SageMaker Schulungen zu skalieren. Sie können bis zu 50 Serviceumgebungen pro Konto erstellen, wobei jede Auftragswarteschlange nur eine zugeordnete Serviceumgebung unterstützt. Darüber hinaus ist der Service Request Payload für einzelne Jobs auf 10 KiB begrenzt, und die SubmitServiceJob API ist auf 5 Transaktionen pro Sekunde pro Konto begrenzt. Wenn Sie diese Grenzen bei der Kapazitätsplanung kennen, werden unerwartete Skalierungsbeschränkungen vermieden.

Eine effektive Überwachung von Serviceumgebungen erfordert die Beachtung sowohl der KI-Servicemetriken als AWS Batch auch der SageMaker KI-Servicemetriken. Jobstatusübergänge bieten wertvolle Einblicke in die Systemleistung, insbesondere in die Zeit, die im SCHEDULED Status verbracht wurde, was auf Muster der Kapazitätsverfügbarkeit hindeutet. Serviceumgebungen behalten ihren eigenen Lebenszyklusstatus bei, ähnlich wie RechenumgebungenCREATING, und wechseln dabei durch VALIDINVALID,, und DELETING Zustände, deren Betriebszustand überwacht werden sollte. Organizations mit ausgereiften Überwachungspraktiken verfolgen in der Regel die Warteschlangentiefe, die Auftragsabschlussraten und die Instanznutzungsmuster, um die Konfigurationen ihrer Serviceumgebung im Laufe der Zeit zu optimieren.