PERF02-BP02 Entenda a configuração e os recursos de computação disponíveis
Entenda as opções de configuração e os recursos disponíveis para seu serviço de computação a fim de ajudar a provisionar a quantidade certa de recursos e melhorar a eficiência do desempenho.
Antipadrões comuns:
-
Você não avalia as opções de computação ou as famílias de instâncias disponíveis em relação às características da workload.
-
Você provisiona recursos de computação em excesso para atender aos requisitos de pico de demanda.
Benefícios de estabelecer esta prática recomendada: familiarizar-se com os atributos e as configurações de computação da AWS a fim de poder usar uma solução de computação otimizada para atender às características e às necessidades da workload.
Nível de risco exposto se esta prática recomendada não for estabelecida: Médio
Orientação para implementação
Cada solução de computação tem configurações e recursos exclusivos disponíveis para suportar diferentes características e requisitos das workloads. Saiba como essas opções complementam sua workload e determine quais opções de configuração são melhores para sua aplicação. Exemplos dessas opções são famílias de instâncias, tamanhos, recursos (GPU, E/S), expansão, tempos limite, tamanhos de função, instâncias de contêineres e simultaneidade. Se a workload estiver usando a mesma opção de computação há mais de quatro semanas, e se a previsão for de que as características permanecerão as mesmas no futuro, você poderá usar o AWS Compute Optimizer
Etapas da implementação
-
Entenda os requisitos da workload (como necessidade de CPU, memória e latência).
-
Analise a documentação e as práticas recomendadas da AWS para saber mais sobre as opções de configuração indicadas que podem ajudar a melhorar a performance da computação. Aqui estão algumas das principais opções de configuração a serem consideradas:
Opção de configuração Exemplos Tipo de instância -
As instâncias otimizadas para computação
são ideais para workloads que exigem uma proporção maior de vCPU/memória. -
As instâncias otimizadas para memória
entregam grandes quantidades de memória para oferecer compatibilidade com as workloads com uso intenso de memória. -
As instâncias otimizadas para armazenamento
são projetadas para workloads que exigem alta leitura sequencial e acesso de gravação (IOPS) no armazenamento local.
Modelo de definição de preço -
Instâncias sob demanda
permitem usar a capacidade de computação pela hora ou segundo sem uma confirmação de longo prazo. Essas instâncias são ideais para expansões acima das necessidades de desempenho da linha de base. -
Savings Plans
oferecem economias significativas em relação às instâncias sob demanda em troca do compromisso de usar uma quantidade específica de potência computacional por um período de um ou três anos. -
instâncias spot.
permitem que você aproveite a capacidade da instância não utilizada com um desconto para as workloads sem estado e tolerantes a falhas.
Auto Scaling Use o Auto Scaling configuração para combinar recursos computacionais com padrões de tráfego. Dimensionamento -
Use Compute Optimizer
para obter uma recomendação de machine learning sobre a configuração de computação que corresponde melhor às características da computação. -
Use AWS Lambda Power Tuning para selecionar a melhor configuração para a função do Lambda.
Aceleradores de computação baseados em hardware -
As instâncias com computação acelerada executam funções como processamento gráfico ou correspondência de padrões de dados com mais eficiência do que as alternativas baseadas em CPU.
-
Para workloads de machine learning, utilize hardware específico para sua workload, como AWS Trainium
, AWS Inferentia e o Amazon EC2 DL1
-
Recursos
Documentos relacionados:
Vídeos relacionados:
Exemplos relacionados: