Disponibilidade e durabilidade: sistemas de arquivos single-AZ e multi-AZ - Amazon FSx para Windows File Server

Disponibilidade e durabilidade: sistemas de arquivos single-AZ e multi-AZ

O Amazon FSx para Windows File Server oferece dois tipos de implantação de sistema de arquivos: single-AZ e multi-AZ. As seções a seguir fornecem informações para ajudar você a escolher o tipo certo de implantação para suas workloads. Para obter informações sobre o SLA (Acordo de Nível de Serviço) de disponibilidade do serviço, consulte Amazon FSx Service Level Agreement.

Os sistemas de arquivos single-AZ são compostos por uma única instância do servidor de arquivos do Windows e um conjunto de volumes de armazenamento em uma única zona de disponibilidade (AZ). Com os sistemas de arquivos single-AZ, os dados são replicados automaticamente para protegê-los contra a falha de um único componente na maioria dos casos. O Amazon FSx monitora continuamente a existência de falhas de hardware e se recupera automaticamente de eventos de falha, substituindo o componente de infraestrutura com falha. Os sistemas de arquivos single-AZ geralmente apresentam cerca de 30 minutos de tempo de inatividade durante eventos de recuperação de falhas e durante a janela de manutenção planejada que você configura para o seu sistema de arquivos. Com os sistemas de arquivos single-AZ, a falha do sistema de arquivos pode ser irrecuperável em casos raros, como devido a falhas de vários componentes ou devido a uma falha não progressiva do servidor de arquivos único que deixa o sistema de arquivos em um estado inconsistente. Nesse caso, é possível recuperar o sistema de arquivos a partir do backup mais recente.

Os sistemas de arquivos multi-AZ são compostos por um cluster de alta disponibilidade de servidores de arquivos do Windows espalhados por duas AZs (uma AZ preferencial e uma AZ em espera), aproveitando a tecnologia de cluster de failover do Windows Server (WSFC) e um conjunto de volumes de armazenamento em cada uma das duas AZs. Os dados são replicados de forma síncrona em cada AZ individual e entre as duas AZs. Em relação à implantação single-AZ, as implantações multi-AZ oferecem durabilidade aprimorada por meio da replicação adicional de dados entre AZs e disponibilidade aprimorada durante a manutenção planejada do sistema e a interrupção não planejada do serviço por meio de failover automático para a AZ em espera. Isso permite que você continue acessando seus dados e ajuda a protegê-los contra falhas de instância e interrupção da AZ.

Como escolher o tipo de implantação do sistema de arquivos single-AZ ou multi-AZ

Recomendamos o uso de sistemas de arquivos multi-AZ para a maioria das workloads de produção, dado o modelo de alta disponibilidade e durabilidade que ele oferece. A implantação do single-AZ foi projetada como uma solução econômica para workloads de teste e desenvolvimento, determinadas workloads de produção que têm replicação incorporada à camada de aplicações e não exigem redundância adicional no nível de armazenamento, além de workloads de produção que têm disponibilidade reduzida e necessidades de objetivo de ponto de recuperação (RPO). As workloads com disponibilidade relaxada e necessidades de RPO podem tolerar a perda temporária de disponibilidade por até 20 minutos no caso de manutenção planejada do sistema de arquivos ou interrupção não planejada do serviço e, em casos raros, a perda de atualizações de dados desde o backup mais recente.

Também recomendamos revisar o modelo de disponibilidade do seu sistema de arquivos e garantir que sua workload seja resiliente ao comportamento de recuperação esperado para o tipo de implantação escolhido durante eventos como manutenção do sistema de arquivos, alterações na capacidade de throughput e interrupções não planejadas do serviço.

Suporte a recursos por tipo de implantação

A tabela a seguir resume os recursos compatíveis com os tipos de implantação do sistema de arquivos do FSx para Windows File Server.

Tipo de implantação Armazenamento em SSD Armazenamento em HDD Namespaces DFS Replicação do DFS Nomes DNS personalizados Compartilhamentos CA
single-AZ 1
single-AZ 2 ✓*
multi-AZ ✓*
nota

* Embora seja possível criar compartilhamentos continuamente disponíveis (CA) em sistemas de arquivos single-AZ 2, você deve usar compartilhamentos CA em sistemas de arquivos multi-AZ para implantações de alta disponibilidade do SQL Server.

Processo de failover

Os sistemas de arquivos multi-AZ fazem failover automaticamente do servidor de arquivos preferencial para o servidor de arquivos em espera se ocorrer alguma das seguintes condições:

  • Ocorre uma interrupção na zona de disponibilidade.

  • O servidor de arquivos preferencial fica indisponível.

  • O servidor de arquivos preferencial passa por manutenção planejada.

Ao fazer o failover de um servidor de arquivos para outro, o novo servidor de arquivos ativo começa automaticamente a atender a todas as solicitações de leitura e gravação do sistema de arquivos. Quando os recursos na sub-rede preferencial estão disponíveis, o Amazon FSx automaticamente retorna ao servidor de arquivos preferencial na sub-rede preferencial. Normalmente, um failover é concluído em menos de 30 segundos, desde a detecção da falha no servidor de arquivos ativo até a promoção do servidor de arquivos em espera para o status ativo. O failback para a configuração original do multi-AZ também é concluído em menos de 30 segundos e só ocorre quando o servidor de arquivos na sub-rede preferencial é totalmente recuperado.

Durante o breve período em que seu sistema de arquivos está passando por failback, a E/S pode ser pausada e as métricas do Amazon CloudWatch podem ficar temporariamente indisponíveis. Para sistemas de arquivos multi-AZ, todas as atividades de leitura e gravação de arquivos que ocorrer durante o failover e o failback deverão ser sincronizadas entre os servidores de arquivos primário e secundário. Pode levar várias horas até que os sistemas de arquivos com armazenamento HDD e as workloads com alto índice de gravação e de IOPS concluam esse processo. Recomendamos testar o impacto dos failovers em sua aplicação enquanto o sistema de arquivos estiver sob uma carga mais leve.

Experiência de failover em clientes Windows

Ao fazer o failover de um servidor de arquivos para outro, o novo servidor de arquivos ativo começa automaticamente a oferecer serviços a todas as solicitações de leitura e gravação do sistema de arquivos. Depois que os recursos na sub-rede preferencial estiverem disponíveis, o Amazon FSx passa por failback automaticamente ao servidor de arquivos preferencial na sub-rede preferencial. Como o nome DNS do sistema de arquivos permanece o mesmo, os failovers são transparentes para as aplicações do Windows, que retomam as operações do sistema de arquivos sem intervenção manual. Normalmente, um failover é concluído em menos de 30 segundos, desde a detecção da falha no servidor de arquivos ativo até a promoção do servidor de arquivos em espera para o status ativo. O failback para a configuração original do multi-AZ também é concluído em menos de 30 segundos e só ocorre depois que o servidor de arquivos na sub-rede preferencial é totalmente recuperado.

Experiência de failover em clientes Linux

Os clientes Linux não são compatíveis com failover automático baseado em DNS. Portanto, eles não se conectam automaticamente ao servidor de arquivos em espera durante um failover. Eles retomarão automaticamente as operações do sistema de arquivos depois que o sistema de arquivos multi-AZ falhar e voltar para o servidor de arquivos na sub-rede preferencial.

Como testar o failover em um sistema de arquivos

Você pode testar o failover do seu sistema de arquivos multi-AZ modificando sua capacidade de throughput. Quando você modifica a capacidade de throughput do seu sistema de arquivos, o Amazon FSx alterna o servidor de arquivos do sistema de arquivos. Os sistemas de arquivos multi-AZ fazem failover automaticamente para o servidor secundário, enquanto o Amazon FSx substitui primeiro o servidor de arquivos do servidor preferencial. Em seguida, o sistema de arquivos volta automaticamente para o novo servidor primário e o Amazon FSx substitui o servidor de arquivos secundário.

Você pode monitorar o progresso da solicitação de atualização da capacidade de throughput no console do Amazon FSx, na CLI e na API. Após a conclusão bem-sucedida da atualização, o sistema de arquivos passou por failover para o servidor secundário e passou por failover de volta ao servidor primário. Para obter mais informações sobre como modificar a capacidade de throughput do sistema de arquivos e monitorar o progresso da solicitação, consulte Como gerenciar a capacidade de throughput.

Recursos do sistema de arquivos single e multi-AZ

Os sistemas de arquivos single-AZ e multi-AZ consomem sub-redes e interfaces de rede elásticas de forma diferente, conforme explicado nas seções a seguir.

Sub-redes

Quando você cria uma nuvem privada virtual (VPC), ela abrange todas as zonas de disponibilidade (AZs) da Região da AWS. As zonas de disponibilidade são locais distintos projetados para serem isolados de falhas em outras zonas de disponibilidade. Depois de criar uma VPC, você pode adicionar uma ou mais sub-redes em cada zona de disponibilidade. A VPC padrão possui uma sub-rede em cada zona de disponibilidade. Uma sub-rede consiste em um intervalo de endereços IP na VPC. Cada sub-rede fica alocada em uma única zona de disponibilidade.

Os sistemas de arquivos do FSx para Windows File Server single-AZ exigem uma sub-rede especificada no momendo da criação. A sub-rede escolhida define a zona de disponibilidade na qual o sistema de arquivos é criado.

Os sistemas de arquivos multi-AZ exigem duas sub-redes, uma para o servidor de arquivos preferencial e outra para o servidor de arquivos em espera. As duas sub-redes que você escolher devem estar em zonas de disponibilidade diferentes dentro da mesma região da AWS.

Para aplicações na AWS, recomendamos que você inicie seus clientes na mesma zona de disponibilidade do seu servidor de arquivos preferencial para minimizar a latência.

Interfaces de rede elástica do sistema de arquivos

Interfaces de rede elástica são componentes lógicos de rede em uma VPC que representa uma cartão de rede virtual. Quando você cria um sistema de arquivos do Amazon FSx, o Amazon FSx provisiona uma ou mais interfaces de rede elástica na VPC que você associa ao seu sistema de arquivos. A interface de rede elástica permite que os clientes se comuniquem e montem o sistema de arquivos. A interface de rede elástica é considerada como estando dentro do escopo de serviço do Amazon FSx, apesar de fazer parte da VPC de sua conta. Os sistemas de arquivos multi-AZ têm duas interfaces de rede elástica, uma para cada servidor de arquivos. Os sistemas de arquivos single-AZ têm uma interface de rede elástica.

Atenção

Não modifique ou exclua as interfaces de rede elástica associadas ao seu sistema de arquivos. A modificação ou a exclusão da interface de rede pode causar uma perda permanente de conexão entre a VPC e o sistema de arquivos.

A tabela a seguir resume a utilização de recursos de sistemas de arquivos do FSx para Windows File Server single-AZ e multi-AZ:

Tipo de implantação do sistema de arquivos Número de sub-redes Número de interfaces de rede elástica Número de endereços IP
single-AZ 2 1 1 2
single-AZ 1 1 1 1
multi-AZ 2 2 4

Depois que um sistema de arquivos é criado, seus endereços IP não mudam até que o sistema de arquivos seja excluído.

Importante

O Amazon FSx não é compatível com o acesso a sistemas de arquivos ou com a exposição do sistema de arquivos à Internet pública. Se um endereço IP elástico, que é um endereço IP público acessível pela Internet, for anexado à interface de rede elástica de um sistema de arquivos, o Amazon FSx o desconectará automaticamente.