Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
In cosa si trovano gli ambienti di servizio AWS Batch
Un ambiente di servizio è una AWS Batch risorsa che contiene i parametri di configurazione necessari per l'integrazione AWS Batch con l' SageMaker intelligenza artificiale. Gli ambienti di servizio AWS Batch consentono di inviare e gestire i lavori AWS Batch di SageMaker formazione fornendo al contempo funzionalità di coda, pianificazione e gestione delle priorità.
Gli ambienti di servizio risolvono le sfide comuni che i team di data science devono affrontare nella gestione dei carichi di lavoro di machine learning. Le organizzazioni spesso limitano il numero di istanze disponibili per i modelli di formazione per evitare spese eccessive accidentali, rispettare i vincoli di budget, risparmiare sui costi con le istanze riservate o utilizzare tipi di istanze specifici per i carichi di lavoro. Tuttavia, i data scientist potrebbero voler eseguire più carichi di lavoro contemporaneamente di quanto sia possibile con le istanze loro allocate, il che richiede un coordinamento manuale per decidere quali carichi di lavoro eseguire e quando.
Questa sfida di coordinamento ha un impatto sulle organizzazioni di tutte le dimensioni, dai team con pochi data scientist alle operazioni su larga scala. Man mano che le organizzazioni crescono, la complessità aumenta, richiedendo più tempo per gestire il coordinamento dei carichi di lavoro e spesso richiedendo il coinvolgimento degli amministratori dell'infrastruttura. Queste attività manuali fanno perdere tempo e riducono l'efficienza delle istanze, con conseguenti costi reali per i clienti.
Grazie agli ambienti di servizio, i data scientist e gli ingegneri ML possono inviare lavori di SageMaker formazione con priorità a code configurabili, garantendo l'esecuzione automatica dei carichi di lavoro senza intervento non appena le risorse sono disponibili. Questa integrazione sfrutta le ampie funzionalità AWS Batch di coda e pianificazione di cui dispone, consentendo ai clienti di personalizzare le proprie politiche di coda e pianificazione per soddisfare gli obiettivi della propria organizzazione.
In che modo gli ambienti di servizio interagiscono con altri componenti AWS Batch
Gli ambienti di servizio si integrano con altri AWS Batch componenti per consentire l'accodamento dei lavori di SageMaker formazione:
-
Job queues: gli ambienti di servizio sono associati alle code di lavoro per consentire alla coda di elaborare i lavori di servizio per il job Training SageMaker
-
Lavori di servizio: quando si invia un lavoro di servizio a una coda associata a un ambiente di servizio, AWS Batch utilizza la configurazione dell'ambiente per inviare il lavoro di formazione corrispondente SageMaker
-
Politiche di pianificazione: gli ambienti di servizio utilizzano politiche di AWS Batch pianificazione per stabilire le priorità e gestire l'ordine di esecuzione dei lavori di formazione SageMaker
Questa integrazione consente di sfruttare le funzionalità AWS Batch di coda e pianificazione già esistenti, mantenendo al contempo la piena funzionalità e flessibilità dei lavori di formazione. SageMaker
Le migliori pratiche per gli ambienti di servizio
Gli ambienti di servizio forniscono funzionalità per la gestione dei lavori di SageMaker formazione su larga scala. Seguire queste best practice consente di ottimizzare costi, prestazioni ed efficienza operativa evitando al contempo problemi di configurazione comuni che possono influire sui flussi di lavoro di machine learning.
Quando pianificate la capacità dell'ambiente di servizio, prendete in considerazione le quote e i limiti specifici che si applicano alle richieste di lavoro relative alla SageMaker formazione. Ogni ambiente di servizio ha un limite di capacità massima espresso in numero di istanze, che controlla direttamente il numero di job di SageMaker formazione che possono essere eseguiti contemporaneamente. La comprensione di questi limiti aiuta a prevenire la contesa delle risorse e garantisce tempi di esecuzione dei lavori prevedibili.
Le prestazioni ottimali dell'ambiente di servizio dipendono dalla comprensione delle caratteristiche uniche della pianificazione dei lavori di SageMaker formazione. A differenza dei tradizionali lavori containerizzati, i lavori di assistenza passano da uno SCHEDULED stato all'altro mentre l' SageMaker IA acquisisce e fornisce le istanze di formazione necessarie. Ciò significa che gli orari di inizio dei lavori possono variare in modo significativo in base alla disponibilità delle istanze e alla capacità regionale.
Importante
Gli ambienti di servizio hanno quote specifiche che possono influire sulla capacità di scalare i carichi di lavoro di SageMaker formazione. È possibile creare fino a 50 ambienti di servizio per account, con ogni coda di lavoro che supporta solo un ambiente di servizio associato. Inoltre, il payload di Service Request per i singoli job è limitato a 10 KiB e l'SubmitServiceJobAPI è limitata a 5 transazioni al secondo per account. La comprensione di questi limiti durante la pianificazione della capacità previene vincoli di scalabilità imprevisti.
Un monitoraggio efficace degli ambienti di servizio richiede attenzione sia AWS Batch alle metriche dei servizi di SageMaker intelligenza artificiale. Le transizioni dello stato del lavoro forniscono informazioni preziose sulle prestazioni del sistema, in particolare sul tempo trascorso in SCHEDULED stato, che indica i modelli di disponibilità della capacità. Gli ambienti di servizio mantengono i propri stati del ciclo di vita simili agli ambienti di elaborazione, in fase di transizione e agli CREATING DELETING stati che devono essere INVALID monitorati per verificarne lo stato operativo. VALID Organizations con pratiche di monitoraggio consolidate in genere tengono traccia della profondità delle code, dei tassi di completamento dei lavori e dei modelli di utilizzo delle istanze per ottimizzare le configurazioni degli ambienti di servizio nel tempo.