As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Coletar requisitos para a migração
A primeira etapa de uma migração de dados de grande porte requer a coleta de uma variedade de informações em toda a organização.
Essas informações ajudam você a criar um processo de migração que, para migrações de grande porte, pode incluir várias transferências e procedimentos para cortar as operações (feitas em ondas) do armazenamento de origem até o destino.
Entender por que você deseja migrar
Antes de começar a migrar para a AWS, você precisa entender claramente por que está migrando os dados. Isso ajuda a enfrentar desafios comuns de migração, como cumprir prazos, gerenciar recursos e coordenar as equipes.
Se precisar de ajuda para determinar as motivações para a migração, responda a estas perguntas:
-
Você quer liberar espaço de armazenamento on-premises?
-
Você quer cumprir os prazos dos contratos de suporte de hardware?
-
Isso se destina à desativação de um data center?
-
Qual é a linha do tempo da migração?
-
Você quer transferir dados de outro armazenamento em nuvem?
-
Você quer migrar conjuntos de dados parciais ou completos?
-
Isso se destina ao arquivamento de dados?
-
As aplicações ou usuários precisam de acesso regular a esses dados?
Como entender a logística
Aborde algumas logísticas básicas sobre o ambiente de armazenamento, a migração e a organização:
-
Obtenha uma compreensão básica da infraestrutura atual de armazenamento de dados.
-
Verifique se você precisa de um atendente do DataSync. Por exemplo, você precisará de um atendente se você estiver transferindo do armazenamento on-premises.
-
Se você precisar de um atendente, certifique-se de entender os requisitos do atendente:
-
Um atendente pode executar como uma máquina virtual (VM) no VMware ESXi, em uma máquina virtual baseada em kernel (KVM) do Linux ou em hipervisor Microsoft Hyper-V. Você também pode implantar um atendente como uma instância do Amazon EC2 dentro da AWS.
-
Migrações de grande porte tipicamente consomem muita memória. Certifique-se de que o atendente tenha RAM suficiente.
-
-
Identifique as principais partes interessadas dos departamentos de liderança, rede, armazenamento e TI que precisam estar envolvidas na migração. Elas podem incluir:
-
Encontre um(a) líder que se dedique ao projeto e aos resultados.
-
Determine quem é responsável pela propriedade e classificação dos dados que você está migrando.
-
Identifique quem gerencia a fonte e quem, por fim, gerenciará o serviço de armazenamento AWS para o qual você está migrando.
-
Descubra quem criará e gerenciará quaisquer outros processos para os dados depois que eles estiverem na AWS.
-
-
Estabeleça canais de comunicação entre departamentos.
-
Crie um plano de reversão para contingências.
-
Documente o processo completo de migração, incluindo ondas, validação e procedimentos de substituição. Use isso como um runbook para toda a migração. Você atualizará esse processo ao planejar e implementar a migração.
Como analisar os dados que você está migrando
Trabalhe com as equipes de armazenamento e aplicações para analisar as características dos dados que você está migrando. Essas informações ajudam a determinar uma estratégia de migração que você pode executar com o DataSync.
Sumário
Como determinar os padrões de uso de dados
-
Para dados usados ativamente com modificações frequentes, planeje várias ondas de transferências incrementais para evitar interromper as operações comerciais.
-
Para dados somente para leitura que podem ser considerados arquivados, talvez você não precise planejar ondas.
-
Se você tiver uma combinação de padrões de uso de dados, planeje ondas que migrem esses diferentes conjuntos de dados separadamente. Por exemplo, você pode ter uma onda para arquivar dados, com as ondas restantes dedicadas à migração de dados ativos.
Como identificar a estrutura e o layout dos dados
-
Determine se os dados estão organizados por períodos (ano, mês, dia) ou outros padrões.
-
Use essa estrutura organizacional para planejar as ondas de migração. Por exemplo, você pode migrar o equivalente a um ano de dados arquivados durante uma onda.
Como documentar compartilhamentos e pastas
-
Crie um inventário de compartilhamentos e pastas (incluindo contagens de arquivos ou objetos para cada um).
-
Identifique compartilhamentos e pastas com conjuntos de dados ativos. Isso pode exigir transferências incrementais durante a migração.
-
Analise as cotas do DataSync. Isso pode ajudar a planejar o particionamento do conjunto de dados ao configurar o DataSync.
Como analisar os tamanhos dos arquivos
-
Espere um throughput de dados maior para transferências com arquivos maiores (MB ou GB) em comparação com arquivos menores (KB).
-
Se você estiver trabalhando com muitos arquivos menores, espere mais operações de metadados em seu sistema de armazenamento e menor throughput de dados. O DataSync executa essas operações ao comparar e verificar os locais de origem e de destino.
Como identificar os requisitos de armazenamento
Para escolher um serviço de armazenamento AWS compatível para migrar os dados, você precisa avaliar as características e o desempenho do sistema de armazenamento de origem.
Essas informações também podem ajudar a programar as transferências para minimizar o impacto nas operações comerciais durante a migração.
Sumário
Como determinar o suporte ao armazenamento de origem
O DataSync pode funcionar com uma variedade de sistemas de armazenamento que permitem acesso por meio de clientes de armazenamento de objetos compatíveis com NFS, SMB, HDFS e S3.
Se você estiver migrando de outro armazenamento em nuvem, verifique se o DataSync pode funcionar com esse provedor. Para ver uma lista dos locais de fonte suportados, consulte Para onde posso transferir meus dados com AWS DataSync?.
Como analisar os requisitos de preservação de metadados
O DataSync pode preservar os metadados de seus arquivos ou objetos durante uma transferência. A forma como os metadados são preservados depende dos locais de transferência e se esses locais usam tipos semelhantes de metadados.
Em alguns casos, o DataSync precisa de permissões adicionais para preservar os metadados do arquivo, como listas de acesso discricionário (DACLs) do NTFS.
Para obter mais informações, consulte Entendendo como DataSync manipula metadados de arquivos e objetos.
Como coletar métricas de desempenho do armazenamento de origem
Meça o IOPS básico e o throughput do disco durante workloads médias e de pico para o armazenamento de origem. A transferência de dados adiciona sobrecarga de I/O aos sistemas de armazenamento de origem e de destino.
Compare esses dados de desempenho com as especificações do sistema de armazenamento para determinar os recursos de desempenho disponíveis.
Como escolher um serviço de armazenamento AWS do destino
Agora você pode ter uma ideia de qual serviço de armazenamento da AWS faz sentido para os dados. Caso contrário, os padrões de uso de dados e o desempenho do armazenamento são algumas áreas a serem consideradas ao decidir. Por exemplo, você pode considerar o Amazon S3 se tiver dados de arquivamento e o Amazon FSx ou o Amazon EFS para dados ativos.
Para ajudar a decidir-se quanto ao armazenamento baseado em objetos ou arquivos certo para os dados, consulte Como escolher um serviço de armazenamento da AWS.
Como determinar os requisitos de rede
Para migrar os dados com o DataSync, você deve estabelecer conexões de rede entre o armazenamento de origem, o atendente e a AWS. Você também precisa planejar a largura de banda e a infraestrutura de rede suficientes.
Trabalhe com engenheiros de rede e administradores de armazenamento para reunir os seguintes requisitos de rede.
Sumário
Como avaliar a largura de banda da rede disponível
A largura de banda da rede disponível influencia as velocidades de transferência e o tempo geral de migração. Se você estiver transferindo de um sistema de armazenamento on-premises, faça o seguinte:
-
Trabalhe com a equipe de rede para determinar a utilização média e máxima da largura de banda.
-
Identifique as janelas em que você pode transferir dados e evite interromper as operações diárias. Isso informará quando as ondas de migração e substituições acontecem.
Você pode controlar a quantidade de largura de banda que o DataSync usa. Para obter mais informações, consulte Definir limites de largura de banda para a tarefa de AWS DataSync.
Como as transferências de outro armazenamento em nuvem geralmente acontecem pela Internet pública, geralmente há menos restrições e considerações de largura de banda com essas transferências.
Como considerar opções para conectar a rede à AWS
Considere as seguintes opções para estabelecer a conectividade de rede para a transferência do DataSync:
-
Direct Connect — Analise os exemplos de arquitetura e roteamento para usar o Direct Connect com o DataSync. Você pode monitorar a atividade do Direct Connect usando o Amazon CloudWatch.
-
VPN — AWS Site-to-Site VPN oferece throughput de até 1,25 Gbps por túnel.
-
Internet pública — Entre em contato com o provedor de serviços de Internet para obter os dados de uso da rede.
Como escolher um endpoint de serviço para a comunicação do atendente
Os atendentes do DataSync usam endpoints de serviço para se comunicar com o serviço DataSync. O tipo de endpoint que você usa depende de como você se conectá à rede da AWS.
Como planejar uma infraestrutura de rede suficiente
Para cada tarefa de transferência que você cria, o DataSync gera e gerencia automaticamente a infraestrutura de rede para as transferências de dados. Essa infraestrutura é conhecida como interfaces de rede ou interfaces de rede elásticas, que são componentes lógicos de rede em uma nuvem privada virtual (VPC) da Amazon que representam placas de rede virtuais. Para obter mais informações, consulte o Guia do usuário do Amazon EC2.
Cada interface de rede usa um único endereço IP na sub-rede VPC de destino. Para garantir que você tenha infraestrutura de rede suficiente para a migração, faça o seguinte:
-
Observe o número de interfaces de rede que o DataSync criará para o local de destino do DataSync.
-
Certifique-se de que a sub-rede tenha endereços IP suficientes para as tarefas do DataSync. Por exemplo, uma tarefa que usa um atendente requer quatro endereços IP. Se você criar quatro tarefas para a migração, isso significa que você precisa de 16 endereços IP disponíveis na sub-rede.