PERF02-BP06 Uso di acceleratori di elaborazione ottimizzati basati su hardware
Usa gli acceleratori hardware per eseguire determinate funzioni in modo più efficiente rispetto alle alternative basate sulla CPU.
Anti-pattern comuni:
-
Nel carico di lavoro non hai confrontato un'istanza generica con un'istanza dedicata in grado di offrire prestazioni più elevate e costi inferiori.
-
Usi gli acceleratori di calcolo basati su hardware per attività in cui sono più efficienti le alternative basate su CPU.
-
Utilizzo delle GPU non monitorato.
Vantaggi dell'adozione di questa best practice: utilizzando gli acceleratori basati su hardware, come le unità di elaborazione grafica (GPU) e gli FPGA (Field Programmable Gate Array), è possibile eseguire determinate funzioni di elaborazione in modo più efficiente.
Livello di rischio associato se questa best practice non fosse adottata: medio
Guida all'implementazione
Le istanze a calcolo accelerato forniscono l'accesso agli acceleratori di calcolo basati su hardware, come GPU e FPGA. Questi acceleratori hardware eseguono alcune funzioni, come l'elaborazione grafica o la rilevazione della corrispondenza dei modelli di dati, in modo più efficiente rispetto alle alternative basate su CPU. Molti carichi di lavoro accelerati, come il rendering grafico, la transcodifica e il machine learning, sono altamente variabili in termini di utilizzo di risorse. Esegui questo hardware solo per il tempo necessario e disattivalo con l'automazione quando non serve per migliorare l'efficienza complessiva delle prestazioni.
Passaggi dell'implementazione
-
Identifica quali istanze a calcolo accelerato possono soddisfare le tue esigenze.
-
Per i carichi di lavoro di machine learning, sfrutta l'hardware specifico per il tuo carico di lavoro, come ad esempio AWS Trainium
, AWS Inferentia e Amazon EC2 DL1 . Le istanze AWS Inferentia come le istanze Inf2 offrono prestazioni per watt superiori fino al 50% rispetto a istanze Amazon EC2 comparabili . -
Raccogli i parametri di utilizzo delle istanze a calcolo accelerato. Ad esempio, puoi utilizzare l'agente CloudWatch per raccogliere metriche come
utilization_gpueutilization_memoryper le tue GPU come mostrato nella sezione relativa alla acquisizione delle metriche della GPU NVIDIA con Amazon CloudWatch. -
Ottimizza il codice, il funzionamento della rete e le impostazioni degli acceleratori hardware per garantire il pieno utilizzo dell'hardware sottostante.
-
Utilizza le librerie e i driver per GPU più recenti e performanti.
-
Utilizza l'automazione per rilasciare le istanze GPU non in uso.
Risorse
Documenti correlati:
Video correlati: