PERF02-BP06 Utilización de aceleradores computacionales optimizados basados en hardware
Use aceleradores de hardware para realizar ciertas funciones de manera más eficiente que con las alternativas basadas en CPU.
Patrones comunes de uso no recomendados:
-
En su carga de trabajo, no ha comparado una instancia de uso general con una instancia personalizada que le pueda ofrecer mayor rendimiento y costes más bajos.
-
Utiliza aceleradores computacionales basados en hardware para tareas en las que podría ser más eficiente utilizar alternativas basadas en CPU.
-
No supervisa el uso de GPU.
Beneficios de establecer esta práctica recomendada: al utilizar aceleradores basados en hardware, como unidades de procesamiento gráfico (GPU) y matrices de puertas programables en campo (FPGA), puede ejecutar determinadas funciones de procesamiento de manera más eficiente.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: Medio
Guía para la implementación
Las instancias de computación acelerada proporcionan acceso a aceleradores de computación basados en hardware, como las GPU y las FPGA. Estos aceleradores de hardware realizan ciertas funciones, como el procesamiento gráfico o la concordancia de patrones de datos, de forma más eficiente que las alternativas basadas en CPU. Muchas cargas de trabajo aceleradas, como el renderizado, la transcodificación y el machine learning, son muy variables en cuanto al uso de recursos. Ejecute este hardware únicamente durante el tiempo necesario y retírelo de forma automatizada cuando no sea necesario para mejorar la eficiencia general del rendimiento.
Pasos para la implementación
-
Identifique qué instancias de computación acelerada pueden satisfacer sus necesidades.
-
Para las cargas de trabajo de machine learning, utilice hardware personalizado específico para su carga de trabajo, como AWS Trainium
, AWS Inferentia y Amazon EC2 DL1 . Las instancias de AWS Inferentia, como las instancias Inf2, ofrecen hasta un 50 % más de rendimiento por vatio en comparación con instancias de Amazon EC2 comparables . -
Recopile las métricas de uso de sus instancias de computación acelerada. Por ejemplo, puede usar un agente de CloudWatch para recopilar métricas como
utilization_gpuyutilization_memorypara sus GPU, como se muestra en Collect NVIDIA GPU metrics with Amazon CloudWatch (Recopilación de métricas de CPU de NVIDIA con Amazon CloudWatch). -
Optimice el código, el funcionamiento de la red y la configuración de los aceleradores de hardware para asegurarse de que se aprovecha al máximo el hardware subyacente.
-
Utilice las bibliotecas de alto rendimiento y los controladores de GPU más recientes.
-
Use la automatización para liberar instancias de GPU cuando no se estén usando.
Recursos
Documentos relacionados:
Vídeos relacionados: