Recuperação automática de falhas Testar os procedimentos de recuperação Dimensione horizontalmente para aumentar a disponibilidade da carga de trabalho agregada Pare de adivinhar a capacidade Gerencie mudanças por meio da automação

Pilar Confiabilidade

O pilar de confiabilidade do AWS Well-Architected Framework aborda o quão bem um sistema mantém a funcionalidade e os níveis de desempenho pretendidos durante os períodos operacionais esperados ao longo de sua vida útil. Ele fornece diretrizes abrangentes para criar e manter sistemas confiáveis AWS, incluindo estratégias para teste e validação em todos os estágios do ciclo de vida da carga de trabalho.

Principais áreas de foco para aplicar esse pilar ao seu ambiente de streaming de WorkSpaces aplicativos:

Gerenciamento e escalabilidade da frota
Confiabilidade da sessão
Disponibilidade da aplicação
Procedimentos de recuperação

Recuperação automática de falhas

Monitore o valor comercial KPIs para acionar respostas automatizadas que possam prever, prevenir ou se recuperar de falhas antes que elas afetem as operações.

Certifique-se de que a alocação de sub-redes IP considere a expansão e a disponibilidade.
Monitore CloudWatch métricas críticas para garantir a disponibilidade e o desempenho do serviço, incluindo métricas de capacidade da frota, como AvailableCapacity eInUseCapacity, e métricas de qualidade de streaming, comoStreamingSessionLatency.
Configure alertas para limites de capacidade, métricas de integridade da sessão, degradação do desempenho e alterações no status de integridade da frota.
Use os recursos de escalabilidade automática de WorkSpaces aplicativos integrados para:
- Configure a capacidade mínima e máxima da frota.
- Defina políticas de escalabilidade com base na utilização da capacidade.
- Defina limites de expansão e expansão com base nas métricas de experiência do usuário e nos requisitos de negócios, em vez de apenas métricas técnicas.
Crie um ambiente de recuperação de desastres para seu ambiente de WorkSpaces aplicativos. Para obter mais informações, consulte a postagem do AWS blog Considerações sobre recuperação de desastres com WorkSpaces aplicativos da Amazon.

Testar os procedimentos de recuperação

Os ambientes em nuvem permitem testes automatizados de cenários de falha e procedimentos de recuperação. Esses recursos ajudam você a identificar e corrigir vulnerabilidades antes que ocorram falhas reais.

Teste de recuperação de frota. Implemente testes abrangentes de recuperação de frota em vários cenários:
- Simule o encerramento da instância para verificar a resposta automática do escalonamento.
- Valide a manutenção da capacidade mínima da frota.
- Tempo de substituição da instância de teste e redirecionamento do usuário.
- Valide a eficácia das políticas de escalabilidade.
- Teste os limites de capacidade da frota e o tratamento de transbordamento.
Teste de recuperação de sessão. Implemente procedimentos de validação de recuperação de sessão:
- Teste cenários de desconexão e reconexão.
- Verifique a preservação do estado do aplicativo.
- Teste vários cenários de interrupção da rede.
- Valide os comportamentos de tempo limite da sessão.
- Verifique a persistência da autenticação do usuário.
- Verifique o manuseio do armazenamento temporário.

Dimensione horizontalmente para aumentar a disponibilidade da carga de trabalho agregada

Distribua sua carga de trabalho em vários recursos menores para minimizar o impacto de falhas individuais e eliminar pontos únicos de falha.

Implante instâncias de frota em várias zonas de disponibilidade.
Configure a capacidade mínima apropriada da frota.
Configure o escalonamento automático para frotas e defina os limites de escalabilidade apropriados.
Monitore a utilização da capacidade em toda a frota.
Implante pilhas de WorkSpaces aplicativos em várias regiões. Para obter mais informações, consulte a postagem do AWS blog Otimize a experiência do usuário com roteamento baseado em latência para aplicativos da Amazon. WorkSpaces

Pare de adivinhar a capacidade

Use os recursos de escalabilidade automática da nuvem para ajustar dinamicamente os recursos com base na demanda. Isso ajuda a evitar a saturação de recursos enquanto mantém a eficiência ideal.

Monitore as principais métricasCapacityUtilization, como,AvailableCapacity, e InUseCapacity para entender as necessidades de capacidade.
Acompanhe as tendências de utilização da frota em diferentes períodos de tempo. Monitore padrões diários, variações semanais, tendências mensais e picos sazonais.
Configure políticas de escalabilidade e configure limites de escalabilidade.
Certifique-se de que existe uma lacuna suficiente entre as cotas atuais e o uso máximo para acomodar o failover.
Projete cotas e restrições de serviço fixas por meio da sua arquitetura.

Gerencie mudanças por meio da automação

Implemente mudanças na infraestrutura por meio da automação, incluindo alterações controladas por versão no próprio código de automação.

Use o IaC para configuração da frota.
Implemente políticas de escalabilidade consistentes.
Use a CLI do Image Assistant para criar imagens de forma consistente.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Pilar Segurança

Pilar Eficiência de performance