As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Pilar Confiabilidade
<a name="reliability"></a>

O [pilar de confiabilidade](https://docs.aws.amazon.com/wellarchitected/latest/framework/reliability.html) do AWS Well-Architected Framework aborda o quão bem um sistema mantém a funcionalidade e os níveis de desempenho pretendidos durante os períodos operacionais esperados ao longo de sua vida útil. Ele fornece diretrizes abrangentes para criar e manter sistemas confiáveis AWS, incluindo estratégias para teste e validação em todos os estágios do ciclo de vida da carga de trabalho.

Principais áreas de foco para aplicar esse pilar ao seu ambiente de streaming de WorkSpaces aplicativos:
+ Gerenciamento e escalabilidade da frota
+ Confiabilidade da sessão
+ Disponibilidade da aplicação
+ Procedimentos de recuperação

## Recuperação automática de falhas
<a name="reliability-recovery"></a>

Monitore o valor comercial KPIs para acionar respostas automatizadas que possam prever, prevenir ou se recuperar de falhas antes que elas afetem as operações.
+ Certifique-se de que a alocação de sub-redes IP considere a expansão e a disponibilidade.
+ Monitore CloudWatch métricas críticas para garantir a disponibilidade e o desempenho do serviço, incluindo métricas de capacidade da frota, como `AvailableCapacity` e`InUseCapacity`, e métricas de qualidade de streaming, como`StreamingSessionLatency`.
+ Configure alertas para limites de capacidade, métricas de integridade da sessão, degradação do desempenho e alterações no status de integridade da frota.
+ Use os recursos de escalabilidade automática de WorkSpaces aplicativos integrados para:
  + Configure a capacidade mínima e máxima da frota.
  + Defina políticas de escalabilidade com base na utilização da capacidade.
  + Defina limites de expansão e expansão com base nas métricas de experiência do usuário e nos requisitos de negócios, em vez de apenas métricas técnicas.
+ Crie um ambiente de recuperação de desastres para seu ambiente de WorkSpaces aplicativos. Para obter mais informações, consulte a postagem do AWS blog [Considerações sobre recuperação de desastres com WorkSpaces aplicativos da Amazon](https://aws.amazon.com/blogs/desktop-and-application-streaming/disaster-recovery-considerations-with-amazon-appstream-2-0/).

## Testar os procedimentos de recuperação
<a name="reliability-test"></a>

Os ambientes em nuvem permitem testes automatizados de cenários de falha e procedimentos de recuperação. Esses recursos ajudam você a identificar e corrigir vulnerabilidades antes que ocorram falhas reais.
+ **Teste de recuperação de frota.** Implemente testes abrangentes de recuperação de frota em vários cenários:
  + Simule o encerramento da instância para verificar a resposta automática do escalonamento.
  + Valide a manutenção da capacidade mínima da frota.
  + Tempo de substituição da instância de teste e redirecionamento do usuário.
  + Valide a eficácia das políticas de escalabilidade.
  + Teste os limites de capacidade da frota e o tratamento de transbordamento.
+ **Teste de recuperação de sessão.** Implemente procedimentos de validação de recuperação de sessão:
  + Teste cenários de desconexão e reconexão.
  + Verifique a preservação do estado do aplicativo.
  + Teste vários cenários de interrupção da rede.
  + Valide os comportamentos de tempo limite da sessão.
  + Verifique a persistência da autenticação do usuário.
  + Verifique o manuseio do armazenamento temporário.

## Dimensione horizontalmente para aumentar a disponibilidade da carga de trabalho agregada
<a name="reliability-scale"></a>

Distribua sua carga de trabalho em vários recursos menores para minimizar o impacto de falhas individuais e eliminar pontos únicos de falha.
+ Implante instâncias de frota em várias zonas de disponibilidade.
+ Configure a capacidade mínima apropriada da frota.
+ Configure o escalonamento automático para frotas e defina os limites de escalabilidade apropriados.
+ Monitore a utilização da capacidade em toda a frota.
+ Implante pilhas de WorkSpaces aplicativos em várias regiões. Para obter mais informações, consulte a postagem do AWS blog [Otimize a experiência do usuário com roteamento baseado em latência para](https://aws.amazon.com/blogs/desktop-and-application-streaming/optimize-user-experience-with-latency-based-routing-for-amazon-appstream-2-0/) aplicativos da Amazon. WorkSpaces 

## Pare de adivinhar a capacidade
<a name="reliability-capacity"></a>

Use os recursos de escalabilidade automática da nuvem para ajustar dinamicamente os recursos com base na demanda. Isso ajuda a evitar a saturação de recursos enquanto mantém a eficiência ideal.
+ Monitore as principais métricas`CapacityUtilization`, como,`AvailableCapacity`, e `InUseCapacity` para entender as necessidades de capacidade.
+ Acompanhe as tendências de utilização da frota em diferentes períodos de tempo. Monitore padrões diários, variações semanais, tendências mensais e picos sazonais.
+ Configure políticas de escalabilidade e configure limites de escalabilidade.
+ Certifique-se de que existe uma lacuna suficiente entre as cotas atuais e o uso máximo para acomodar o failover.
+ Projete cotas e restrições de serviço fixas por meio da sua arquitetura.

## Gerencie mudanças por meio da automação
<a name="reliability-change"></a>

Implemente mudanças na infraestrutura por meio da automação, incluindo alterações controladas por versão no próprio código de automação.
+ Use o IaC para configuração da frota.
+ Implemente políticas de escalabilidade consistentes.
+ Use a [CLI do Image Assistant para criar](https://docs.aws.amazon.com/appstream2/latest/developerguide/cli-operations-managing-creating-image-image-assistant.html) imagens de forma consistente.