As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Pilar Confiabilidade
O pilar de confiabilidade do AWS Well-Architected Framework aborda o quão bem um sistema mantém a funcionalidade e os níveis de desempenho pretendidos durante os períodos operacionais esperados ao longo de sua vida útil. Ele fornece diretrizes abrangentes para criar e manter sistemas confiáveis AWS, incluindo estratégias para teste e validação em todos os estágios do ciclo de vida da carga de trabalho.
Principais áreas de foco para aplicar esse pilar ao seu ambiente de streaming de WorkSpaces aplicativos:
-
Gerenciamento e escalabilidade da frota
-
Confiabilidade da sessão
-
Disponibilidade da aplicação
-
Procedimentos de recuperação
Recuperação automática de falhas
Monitore o valor comercial KPIs para acionar respostas automatizadas que possam prever, prevenir ou se recuperar de falhas antes que elas afetem as operações.
-
Certifique-se de que a alocação de sub-redes IP considere a expansão e a disponibilidade.
-
Monitore CloudWatch métricas críticas para garantir a disponibilidade e o desempenho do serviço, incluindo métricas de capacidade da frota, como
AvailableCapacityeInUseCapacity, e métricas de qualidade de streaming, comoStreamingSessionLatency. -
Configure alertas para limites de capacidade, métricas de integridade da sessão, degradação do desempenho e alterações no status de integridade da frota.
-
Use os recursos de escalabilidade automática de WorkSpaces aplicativos integrados para:
-
Configure a capacidade mínima e máxima da frota.
-
Defina políticas de escalabilidade com base na utilização da capacidade.
-
Defina limites de expansão e expansão com base nas métricas de experiência do usuário e nos requisitos de negócios, em vez de apenas métricas técnicas.
-
-
Crie um ambiente de recuperação de desastres para seu ambiente de WorkSpaces aplicativos. Para obter mais informações, consulte a postagem do AWS blog Considerações sobre recuperação de desastres com WorkSpaces aplicativos da Amazon
.
Testar os procedimentos de recuperação
Os ambientes em nuvem permitem testes automatizados de cenários de falha e procedimentos de recuperação. Esses recursos ajudam você a identificar e corrigir vulnerabilidades antes que ocorram falhas reais.
-
Teste de recuperação de frota. Implemente testes abrangentes de recuperação de frota em vários cenários:
-
Simule o encerramento da instância para verificar a resposta automática do escalonamento.
-
Valide a manutenção da capacidade mínima da frota.
-
Tempo de substituição da instância de teste e redirecionamento do usuário.
-
Valide a eficácia das políticas de escalabilidade.
-
Teste os limites de capacidade da frota e o tratamento de transbordamento.
-
-
Teste de recuperação de sessão. Implemente procedimentos de validação de recuperação de sessão:
-
Teste cenários de desconexão e reconexão.
-
Verifique a preservação do estado do aplicativo.
-
Teste vários cenários de interrupção da rede.
-
Valide os comportamentos de tempo limite da sessão.
-
Verifique a persistência da autenticação do usuário.
-
Verifique o manuseio do armazenamento temporário.
-
Dimensione horizontalmente para aumentar a disponibilidade da carga de trabalho agregada
Distribua sua carga de trabalho em vários recursos menores para minimizar o impacto de falhas individuais e eliminar pontos únicos de falha.
-
Implante instâncias de frota em várias zonas de disponibilidade.
-
Configure a capacidade mínima apropriada da frota.
-
Configure o escalonamento automático para frotas e defina os limites de escalabilidade apropriados.
-
Monitore a utilização da capacidade em toda a frota.
-
Implante pilhas de WorkSpaces aplicativos em várias regiões. Para obter mais informações, consulte a postagem do AWS blog Otimize a experiência do usuário com roteamento baseado em latência para
aplicativos da Amazon. WorkSpaces
Pare de adivinhar a capacidade
Use os recursos de escalabilidade automática da nuvem para ajustar dinamicamente os recursos com base na demanda. Isso ajuda a evitar a saturação de recursos enquanto mantém a eficiência ideal.
-
Monitore as principais métricas
CapacityUtilization, como,AvailableCapacity, eInUseCapacitypara entender as necessidades de capacidade. -
Acompanhe as tendências de utilização da frota em diferentes períodos de tempo. Monitore padrões diários, variações semanais, tendências mensais e picos sazonais.
-
Configure políticas de escalabilidade e configure limites de escalabilidade.
-
Certifique-se de que existe uma lacuna suficiente entre as cotas atuais e o uso máximo para acomodar o failover.
-
Projete cotas e restrições de serviço fixas por meio da sua arquitetura.
Gerencie mudanças por meio da automação
Implemente mudanças na infraestrutura por meio da automação, incluindo alterações controladas por versão no próprio código de automação.
-
Use o IaC para configuração da frota.
-
Implemente políticas de escalabilidade consistentes.
-
Use a CLI do Image Assistant para criar imagens de forma consistente.