As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Resiliência no Amazon Managed Service for Apache Flink
<a name="disaster-recovery-resiliency"></a>

A infraestrutura AWS global é construída em torno de AWS regiões e zonas de disponibilidade. AWS As regiões fornecem várias zonas de disponibilidade fisicamente separadas e isoladas, conectadas a redes de baixa latência, alta taxa de transferência e alta redundância. Com as zonas de disponibilidade, é possível projetar e operar aplicações e bancos de dados que executam o failover automaticamente entre as zonas de disponibilidade sem interrupção. As zonas de disponibilidade são mais altamente disponíveis, tolerantes a falhas e escaláveis que uma ou várias infraestruturas de data center tradicionais. 

Para obter mais informações sobre AWS regiões e zonas de disponibilidade, consulte [Infraestrutura AWS global](https://aws.amazon.com/about-aws/global-infrastructure/).

Além da infraestrutura AWS global, um serviço gerenciado para o Apache Flink oferece vários recursos para ajudar a suportar suas necessidades de resiliência e backup de dados.

## Recuperação de desastres
<a name="disaster-recovery"></a>

O Managed Service for Apache Flink é executado em um modo sem servidor e cuida das degradações do host, da disponibilidade da zona de disponibilidade e outros problemas relacionados à infraestrutura, fazendo uma migração automática. O Managed Service for Apache Flink consegue isso por meio de vários mecanismos redundantes. Cada aplicativo Managed Service for Apache Flink é executado em um cluster do Apache Flink com locatário único. O cluster Apache Flink é executado no modo de alta disponibilidade usando o Zookeeper JobMananger em várias zonas de disponibilidade. O Managed Service for Apache Flink implanta o Apache Flink usando o Amazon EKS. Vários pods do Kubernetes são usados no Amazon EKS para cada AWS região nas zonas de disponibilidade. No caso de uma falha, o Managed Service for Apache Flink tenta em primeiro lugar recuperar o aplicativo dentro do cluster do Apache Flink em execução usando os pontos de verificação do seu aplicativo, se disponível.

O Managed Service for Apache Flink faz backup do estado do aplicativo usando *pontos de verificação* e *snapshots*:
+ Os *pontos de verificação* são backups do estado do aplicativo que o Managed Service for Apache Flink cria automaticamente e periodicamente e para restaurar falhas.
+ Os *Snapshots* são backups do estado do aplicativo que você cria e restaura manualmente.

Para obter mais informações sobre os pontos de verificação e os snapshots, consulte [Implemente a tolerância a falhas](how-fault.md).

## Versionamento
<a name="versioning"></a>

As versões armazenadas do estado do aplicativo são versionadas da seguinte forma:
+ Os *pontos de verificação* são versionados automaticamente pelo serviço. Se o serviço usar um ponto de verificação para reiniciar o aplicativo, o ponto de verificação mais recente será usado. 
+ Os *pontos de salvamento* são versionados usando o **SnapshotName**parâmetro da ação. [CreateApplicationSnapshot](https://docs.aws.amazon.com/managed-flink/latest/apiv2/API_CreateApplicationSnapshot.html)

O Managed Service for Apache Flink criptografa dados armazenados em pontos de verificação e salvamento.