PERF02-BP06 Use optimized hardware-based compute accelerators

Use aceleradores de hardware para executar determinadas funções com mais eficiência do que as alternativas baseadas em CPU.

Antipadrões comuns:

Em sua workload, você não compara uma instância de uso geral com uma instância criada para um propósito específico que possa oferecer maior desempenho e menor custo.
Você está usando aceleradores de computação baseados em hardware para tarefas que podem ser mais eficientes usando alternativas baseadas em CPU.
Você não está monitorando o uso da GPU.

Benefícios de estabelecer esta prática recomendada: Ao usar aceleradores baseados em hardware, como unidades de processamento gráfico (GPUs) e matrizes de portas programáveis em campo (FPGAs), você pode executar determinadas funções de processamento com mais eficiência.

Nível de risco exposto se esta prática recomendada não for estabelecida: Médio

Orientação para implementação

As instâncias com computação acelerada fornecem acesso a aceleradores de computação baseados em hardware, como GPUs e FPGAs. Esses aceleradores de hardware executam certas funções, como processamento gráfico ou correspondência de padrões de dados, com mais eficiência do que alternativas baseadas em CPU. Muitas workloads aceleradas, como renderização, transcodificação e machine learning, são altamente variáveis em termos de uso de recursos. Execute esse hardware apenas pelo tempo necessário e desative-as com automação quando não precisar mais delas para melhorar a eficiência geral do desempenho.

Etapas da implementação

Identifique quais instâncias com computação acelerada podem atender aos seus requisitos.
Para workloads de machine learning, utilize hardware específico para sua workload, como AWS Trainium, AWS Inferentiae o Amazon EC2 DL1. Instâncias do AWS Inferentia, como instâncias Inf2, oferecem até 50% melhor performance/watt em relação a instâncias comparáveis do Amazon EC2.
Colete métricas de uso para as instâncias com computação acelerada. Por exemplo, você pode usar o agente do CloudWatch para coletar métricas como utilization_gpu e utilization_memory para suas GPUs, conforme mostrado em Colete métricas da GPU NVIDIA com o Amazon CloudWatch.
Otimize o código, a operação de rede e as configurações dos aceleradores de hardware para garantir que o hardware subjacente seja totalmente utilizado.
Use as mais recentes bibliotecas de alto desempenho e drivers de GPU.
Use automação para liberar instâncias de GPU quando não estiverem em uso.

Recursos

Documentos relacionados:

Vídeos relacionados:

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

PERF02-BP05 Dimensione recursos de computação dinamicamente

Gerenciamento de dados