Processo de failover para uma implantação multi-AZ do RDS Custom para Oracle - Amazon Relational Database Service

Processo de failover para uma implantação multi-AZ do RDS Custom para Oracle

Se uma interrupção planejada ou não planejada da sua instância de banco de dados for o resultado de um defeito de infraestrutura, o Amazon RDS alternará automaticamente para uma réplica em espera em outra zona de disponibilidade se você tiver ativado o multi-AZ. O tempo de conclusão do failover depende da atividade do banco de dados e de outras condições no momento em que a instância de banco de dados primária se tornou indisponível. Em geral, os tempos de failover variam de 60 a 120 segundos. No entanto, transações grandes ou um processo de recuperação longo podem aumentar o tempo de failover. Quando o failover é concluído, o console do Amazon RDS pode levar mais um tempo para mostrar a nova zona de disponibilidade.

nota

Você pode forçar um failover manualmente ao interromper e iniciar o host primário do EC2 enquanto a instância de banco de dados estiver disponível.

O Amazon RDS processa os failovers automaticamente para que você possa retomar as operações de banco de dados o mais rápido possível e sem intervenção administrativa. A instância de banco de dados principal muda automaticamente para a réplica em espera se alguma das condições descritas na tabela a seguir ocorrer. Os motivos do failover podem ser visualizados no log de eventos do Amazon RDS.

Motivo do failover Descrição
O sistema operacional subjacente à instância de banco de dados do RDS está sendo corrigido em uma operação offline. Um failover foi acionado durante a janela de manutenção para um patch de SO ou uma atualização de segurança. Para obter mais informações, consulte Manutenção de uma instância de banco de dados.
O host principal da instância RDS multi-AZ não está íntegro. A implantação de instância de banco de dados multi-AZ detectou uma instância de banco de dados primária danificada e executou failover.
O host principal da instância RDS multi-AZ está inacessível devido à perda de conectividade de rede. O monitoramento do RDS detectou uma falha de alcançabilidade de rede na instância de banco de dados principal e acionou um failover.
A instância do RDS foi modificada pelo cliente. Uma modificação da instância de banco de dados do RDS acionou um failover. Para obter mais informações, consulte Modificar sua instância de banco de dados do RDS Custom para Oracle.
O volume de armazenamento subjacente ao host principal da instância multi-AZ do RDS sofreu uma falha. A implantação de instância de banco de dados multi-AZ detectou um problema de armazenamento na instância de banco de dados primária e executou o failover.
A instância primária do RDS multi-AZ está ocupada e não responde. A instância de banco de dados principal não responde. Recomendamos que você faça o seguinte: examine o evento e os logs do CloudWatch quanto ao uso excessivo de CPU, memória ou espaço de troca. Para ter mais informações, consulte Trabalhar com a notificação de eventos do Amazon RDS e Criar uma regra que é acionada em um evento do Amazon RDS. Avalie sua workload para determinar se você está usando a classe de instância de banco de dados apropriada. Para obter mais informações, consulte Classes de instâncias de banco de dados .

Para determinar se ocorreu failover na instância de banco de dados multi-AZ, faça o seguinte:

  • Configure assinaturas de eventos de banco de dados para notificar você por e-mail ou SMS de que um failover foi iniciado. Para ter mais informações sobre eventos do , consulte Trabalhar com a notificação de eventos do Amazon RDS.

  • Visualize seus eventos de banco de dados usando o console do Amazon RDS ou operações de API.

  • Visualize o estado atual da implantação da instância de banco de dados multi-AZ do RDS Custom para Oracle usando o console do Amazon RDS, a CLI ou operações de API.

Configurações de vida útil (TTL) com aplicações usando uma implantação multi-AZ do RDS Custom para Oracle

O mecanismo de failover modifica automaticamente o registro de Domain Name System (DNS) da instância de banco de dados para apontar para a instância de banco de dados em espera. Como resultado, você precisará restabelecer todas as conexões existentes para sua instância de banco de dados. Garanta que qualquer valor de configuração de tempo de vida útil do cache DNS (TTL) seja baixo e confirme que sua aplicação não armazene o DNS em cache por um período prolongado. Um valor alto de TTL pode impedir que sua aplicação se reconecte rapidamente à instância de banco de dados após o failover.