REL09-BP01 Identificar e fazer backup de todos os dados que precisam de backup ou reproduzir os dados das fontes
Compreenda e use os recursos de backup dos serviços e recursos de dados usados pela workload. A maioria dos serviços oferece recursos para fazer backup dos dados da workload.
Resultado desejado: as fontes de dados foram identificadas e classificadas com base na criticidade. Depois, estabeleça uma estratégia de recuperação de dados com base no RPO. A estratégia envolve fazer backup dessas fontes de dados ou poder reproduzir dados de outras fontes. Em caso de perda de dados, a estratégia implementada permite a recuperação ou reprodução de dados dentro do RPO e RTO definidos.
Fase de maturidade da nuvem: básica
Antipadrões comuns:
-
Não estar ciente de todas as fontes de dados para a workload e sua criticidade.
-
Não fazer backups de fontes de dados essenciais.
-
Fazer backups apenas de algumas fontes de dados sem usar a criticidade como critério.
-
Não ter um RPO definido ou a frequência de backup não atender ao RPO.
-
Não avaliar a necessidade de um backup ou se os dados podem ser reproduzidos de outras fontes.
Benefícios do estabelecimento dessa prática recomendada: identificar os locais onde os backups são necessários e implementar um mecanismo para criar backups ou poder reproduzir os dados de uma fonte externa melhora a capacidade de restaurar e recuperar dados durante uma interrupção.
Nível de exposição a riscos quando esta prática recomendada não é estabelecida: alto
Orientações para a implementação
Todos os armazenamentos de dados da AWS oferecem recursos de backup. Serviços como o Amazon RDS e o Amazon DynamoDB oferecem suporte adicional ao backup automatizado que permite a recuperação a um ponto anterior no tempo (PITR), permitindo restaurar um backup a qualquer momento até cinco minutos ou menos, antes da hora atual. Muitos serviços da AWS permitem copiar backups para outra Região da AWS. O AWS Backup é uma ferramenta que permite centralizar e automatizar a proteção de dados nos serviços da AWS. O AWS Elastic Disaster Recovery
O Amazon S3 pode ser usado como um destino de backup para fontes de dados autogerenciadas e gerenciadas pela AWS. Os serviços da AWS, como o Amazon EBS, o Amazon RDS e o Amazon DynamoDB, têm recursos integrados para criar backups. É possível também usar um software de backup de terceiros.
E possível fazer backup de dados on-premises na Nuvem AWS usando o AWS Storage Gateway ou o AWS DataSync. Os buckets do Amazon S3 podem ser usados para armazenar esses dados na AWS. O Amazon S3 oferece vários níveis de armazenamento, como Amazon Glacier ou Amazon Glacier Deep Archive para reduzir os custos do armazenamento de dados.
Você pode atender às necessidades de recuperação de dados reproduzindo os dados de outras fontes. Por exemplo, os nós de réplica do Amazon ElastiCache ou as réplicas de leitura do Amazon RDS poderiam ser usadas para reproduzir dados caso os primários sejam perdidos. Em casos em que fontes como essa podem ser usadas para atender ao objetivo de ponto de recuperação (RPO) e objetivo de tempo de recuperação (RTO), pode ser que você não precise de um backup. Outro exemplo, se estiver trabalhando com o Amazon EMR, pode não ser necessário fazer backup do armazenamento de dados HDFS, contanto que você possa reproduzir os dados no Amazon EMR pelo Amazon S3
Ao selecionar uma estratégia de backup, considere o tempo necessário para recuperar os dados. Ele depende do tipo de backup (no caso de uma estratégia de backup) ou da complexidade do mecanismo de reprodução de dados. O tempo deve estar dentro do RTO para a workload.
Etapas da implementação
-
Identifique todas as fontes de dados para a workload. Os dados podem ser armazenados em vários recursos, como bancos de dados
, volumes, sistemas de arquivos, sistemas de registro e armazenamento de objetos. Consulte a seção Recursos para encontrar Documentos relacionados sobre diferentes serviços da AWS onde os dados são armazenados e o recurso de backup que esses serviços fornecem. -
Classifique as fontes de dados com base na criticidade. Diferentes conjuntos de dados terão diferentes níveis de criticidade para uma workload e, portanto, diferentes requisitos de resiliência. Por exemplo, alguns dados podem ser críticos e exigir um RPO próximo de zero, enquanto outros dados podem ser menos críticos e tolerar um RPO mais alto e a perda de alguns dados. Da mesma forma, diferentes conjuntos de dados também podem ter diferentes requisitos de RTO.
-
Use a AWS ou serviços de terceiros para criar backups dos dados. O AWS Backup é um serviço gerenciado que permite criar backups de várias fontes de dados na AWS. O AWS Elastic Disaster Recovery
lida com a replicação de dados automáticos de subsegundos em uma Região da AWS. A maioria dos serviços da AWS também possui recursos nativos para criar backups. O AWS Marketplace tem muitas soluções que também fornecem esses recursos. Consulte os Recursos listados abaixo para obter informações sobre como criar backups de dados de vários serviços da AWS. -
Para dados sem backup, estabeleça um mecanismo de reprodução de dados. Você pode optar por não fazer backup dos dados que podem ser reproduzidos de outras fontes por vários motivos. Às vezes, pode ser mais barato reproduzir dados de fontes se necessário, em vez de criar um backup, pois pode haver um custo associado ao armazenamento de backups. Outro exemplo é quando a restauração de um backup demora mais do que a reprodução dos dados das fontes, resultando em uma violação no RTO. Nestas situações, considere concessões e estabeleça um processo bem definido de como os dados podem ser reproduzidos dessas fontes quando a recuperação de dados for necessária. Por exemplo, se você carregou dados do Amazon S3 para um data warehouse (como o Amazon Redshift) ou para um cluster MapReduce (como o Amazon EMR) para analisá-los, esse é um exemplo de dados que podem ser reproduzidos de outras fontes. Desde que os resultados dessas análises sejam armazenados em algum lugar ou reproduzíveis, você não sofreria uma perda de dados devido a uma falha no data warehouse ou no cluster do MapReduce. Outros exemplos que podem ser reproduzidos de origens incluem caches (como o Amazon ElastiCache) ou réplicas de leitura do RDS.
-
Estabeleça uma frequência para fazer backup de dados. A criação de backups de fontes de dados é um processo periódico, e a frequência deve depender do RPO.
Nível de esforço do plano de implementação: moderado
Recursos
Práticas recomendadas relacionadas:
REL13-BP01 Definir os objetivos de recuperação para tempo de inatividade e perda de dados
REL13-BP02 Usar estratégias de recuperação definidas para cumprir os objetivos de recuperação
Documentos relacionados:
-
What is AWS DataSync? (O que é o AWS Data Sync?)
-
What is Volume Gateway? (O que é o Gateway de Volumes?)
-
AWS Marketplace: products that can be used for backup
(AWS Marketplace: produtos que podem ser usados para backup) -
Backing Up Amazon EFS (Fazer backup do Amazon EFS)
-
Backing up Amazon FSx for Windows File Server (Fazer backup do Amazon FSx para Windows File Server)
-
Creating a DB Cluster Snapshot in Neptune (Criar um snapshot do cluster de banco de dados no Neptune)
-
Creating an EventBridge Rule That Triggers on a Schedule (Criar uma regra do EventBridge que é acionada de acordo com uma programação)
-
Replicação entre regiões com o Amazon S3
-
Exporting Log Data to Amazon S3 (Exportação de dados de log para o Amazon S3)
-
Criação de snapshots de índices no Amazon OpenSearch Service
Vídeos relacionados:
-
AWS re:Invent 2021: Backup, disaster recovery, and ransomware protection with AWS
(Backup, recuperação de desastres e proteção contra ransomware com a AWS) -
AWS Backup Demo: Cross-Account and Cross-Region Backup
(Demonstração: Backup entre contas e entre regiões) -
AWS re:Invent 2019: Deep dive on AWS Backup, ft. Rackspace (STG341)
Exemplos relacionados:
-
Well-Architected Lab - Implementing Bi-Directional Cross-Region Replication (CRR) for Amazon S3
(Laboratório do Well-Architected: implementação da replicação bidirecional entre regiões (CRR) para o Amazon S3) -
Laboratório do Well-Architected: teste de backup e restauração de dados
-
Well-Architected Lab - Backup and Restore with Failback for Analytics Workload
(Laboratório do Well-Architected: backup e restauração com failback para workload do Analytics) -
Well-Architected Lab - Disaster Recovery - Backup and Restore
(Laboratório do Well-Architected: recuperação de desastres: backup e restauração)