Coletar requisitos para a migração - AWS DataSync

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Coletar requisitos para a migração

A primeira etapa de uma migração de dados de grande porte requer a coleta de uma variedade de informações em toda a organização.

Essas informações ajudam você a criar um processo de migração que, para migrações de grande porte, pode incluir várias transferências e procedimentos para cortar as operações (feitas em ondas) do armazenamento de origem até o destino.

Entender por que você deseja migrar

Antes de começar a migrar para AWS, você precisa entender claramente por que está migrando seus dados. Isso ajuda a enfrentar desafios comuns de migração, como cumprir prazos, gerenciar recursos e coordenar as equipes.

Se precisar de ajuda para determinar as motivações para a migração, responda a estas perguntas:

  • Você quer liberar espaço de armazenamento on-premises?

  • Você quer cumprir os prazos dos contratos de suporte de hardware?

  • Isso se destina à desativação de um data center?

  • Qual é a linha do tempo da migração?

  • Você quer transferir dados de outro armazenamento em nuvem?

  • Você quer migrar conjuntos de dados parciais ou completos?

  • Isso se destina ao arquivamento de dados?

  • As aplicações ou usuários precisam de acesso regular a esses dados?

Como entender a logística

Aborde algumas logísticas básicas sobre o ambiente de armazenamento, a migração e a organização:

  1. Obtenha uma compreensão básica da infraestrutura atual de armazenamento de dados.

  2. Verifique se você precisa de um DataSync agente. Por exemplo, você precisará de um atendente se você estiver transferindo do armazenamento on-premises.

  3. Se você precisar de um atendente, certifique-se de entender os requisitos do atendente:

    • Um atendente pode executar como uma máquina virtual (VM) no VMware ESXi, em uma máquina virtual baseada em kernel (KVM) do Linux ou em hipervisor Microsoft Hyper-V. Você também pode implantar um atendente como uma instância do Amazon EC2 dentro da AWS.

    • As migrações de grande porte costumam consumir muita memória. Certifique-se de que o atendente tenha RAM suficiente.

  4. Identifique as principais partes interessadas dos departamentos de liderança, rede, armazenamento e TI que precisam estar envolvidas na migração. Elas podem incluir:

    • Encontre um(a) líder que se dedique ao projeto e aos resultados.

    • Identifique quem é responsável pela propriedade e classificação dos dados que você está migrando.

    • Identifique quem gerencia sua fonte e quem eventualmente gerenciará o serviço AWS de armazenamento para o qual você está migrando.

    • Descubra quem criará e gerenciará quaisquer outros processos para seus dados depois que eles entrarem AWS.

  5. Estabeleça canais de comunicação entre departamentos.

  6. Crie um plano de reversão para contingências.

  7. Documente o processo completo de migração, incluindo ondas, validação e procedimentos de substituição. Use isso como um runbook para toda a migração. Você atualizará esse processo ao planejar e implementar a migração.

Como analisar os dados que você está migrando

Trabalhe com as equipes de armazenamento e aplicações para analisar as características dos dados que você está migrando. Essas informações ajudam a determinar uma estratégia de migração com a qual você pode executar DataSync.

Como definir os padrões de uso de dados

  • Em relação a dados usados ativamente com modificações frequentes, planeje várias ondas de transferências incrementais para evitar a interrupção das operações comerciais.

  • Para dados somente para leitura que podem ser considerados arquivados, talvez você não precise planejar ondas.

  • Se você tiver uma combinação de padrões de uso de dados, planeje ondas que migrem esses diferentes conjuntos de dados separadamente. Por exemplo, você pode ter uma onda para arquivar dados, com as ondas restantes dedicadas à migração de dados ativos.

Como identificar a estrutura e o layout dos dados

  • Determine se os dados estão organizados por períodos (ano, mês, dia) ou outros padrões.

  • Use essa estrutura organizacional para planejar as ondas de migração. Por exemplo, você pode migrar o equivalente a um ano de dados arquivados durante uma onda.

Como documentar compartilhamentos e pastas

  • Crie um inventário de compartilhamentos e pastas (incluindo contagens de arquivos ou objetos para cada um).

  • Identifique compartilhamentos e pastas com conjuntos de dados ativos. Isso pode exigir transferências incrementais durante a migração.

  • Revise as DataSync cotas. Isso pode ajudar você a planejar como particionar seu conjunto de dados durante a configuração DataSync.

Como analisar os tamanhos dos arquivos

  • Espere um throughput de dados maior para transferências com arquivos maiores (MB ou GB) em comparação com arquivos menores (KB).

  • Se você estiver trabalhando com muitos arquivos menores, espere mais operações de metadados em seu sistema de armazenamento e menor taxa de transferência de dados. DataSyncexecuta essas operações ao comparar e verificar seus locais de origem e destino.

Como identificar os requisitos de armazenamento

Para escolher um serviço AWS de armazenamento compatível para migrar seus dados, você precisa avaliar as características e o desempenho do sistema de armazenamento de origem.

Essas informações também podem ajudar a programar as transferências para minimizar o impacto nas operações comerciais durante a migração.

Como determinar o suporte ao armazenamento de origem

DataSync pode trabalhar com uma variedade de sistemas de armazenamento que permitem acesso por meio de clientes de armazenamento de objetos compatíveis com NFS, SMB, HDFS e S3.

Se você estiver migrando de outro armazenamento em nuvem, verifique se ele DataSync funciona com esse provedor. Para ver uma lista dos locais de fonte suportados, consulte Para onde posso transferir meus dados AWS DataSync?.

Como analisar os requisitos de preservação de metadados

DataSync pode preservar seus metadados de arquivo ou objeto durante uma transferência. A forma como os metadados são preservados depende dos locais de transferência e se esses locais usam tipos semelhantes de metadados.

DataSync em alguns casos, precisa de permissões adicionais para preservar os metadados do arquivo, como listas de acesso discricionário do NTFS (). DACLs

Para obter mais informações, consulte Entendendo como DataSync manipula metadados de arquivos e objetos.

Como coletar métricas de desempenho do armazenamento de origem

Meça o IOPS básico e o throughput do disco durante workloads médias e de pico para o armazenamento de origem. A transferência de dados adiciona I/O sobrecarga aos sistemas de armazenamento de origem e de destino.

Compare esses dados de desempenho com as especificações do sistema de armazenamento para determinar os recursos de desempenho disponíveis.

Escolhendo um serviço AWS de armazenamento de destino

Nesse ponto, você pode ter uma ideia de qual serviço AWS de armazenamento faz sentido para seus dados. Caso contrário, os padrões de uso de dados e o desempenho do armazenamento são algumas áreas a serem consideradas ao decidir. Por exemplo, você pode considerar o Amazon S3 se tiver dados de arquivamento e o Amazon ou o FSx Amazon EFS para dados ativos.

Para ajudá-lo a decidir o armazenamento baseado em objetos ou arquivos certo para seus dados, consulte Escolha de um serviço AWS de armazenamento.

Como determinar os requisitos de rede

Para migrar seus dados com DataSync, você deve estabelecer conexões de rede entre o armazenamento de origem, o agente e. AWS Você também precisa planejar a largura de banda e a infraestrutura de rede suficientes.

Trabalhe com engenheiros de rede e administradores de armazenamento para reunir os seguintes requisitos de rede.

Como avaliar a largura de banda da rede disponível

A largura de banda da rede disponível influencia as velocidades de transferência e o tempo geral de migração. Se você estiver transferindo de um sistema de armazenamento on-premises, faça o seguinte:

  • Trabalhe com a equipe de rede para determinar a utilização média e máxima da largura de banda.

  • Identifique as janelas em que você pode transferir dados e evite interromper as operações diárias. Isso informará quando as ondas de migração e substituições acontecem.

Você pode controlar a quantidade de largura de banda DataSync usada. Para obter mais informações, consulte Definindo limites de largura de banda para sua tarefa AWS DataSync.

Como as transferências de outro armazenamento em nuvem geralmente acontecem pela Internet pública, geralmente há menos restrições e considerações de largura de banda com essas transferências.

Considerando as opções para conectar sua rede a AWS

Considere as seguintes opções para estabelecer a conectividade de rede para sua DataSync transferência:

  • Direct Connect- Analise os exemplos de arquitetura e roteamento para usar o Direct Connect with DataSync. Você pode monitorar a atividade do Direct Connect usando a Amazon CloudWatch.

  • VPN: AWS Site-to-Site VPN oferece throughput de até 1,25 Gbps por túnel.

  • Internet pública: entre em contato com o provedor de serviços de Internet para obter os dados de uso da rede.

Como escolher um endpoint de serviço para a comunicação do atendente

DataSync os agentes usam endpoints de serviço para se comunicarem com o DataSync serviço. O tipo de endpoint que você usa depende de como você se conectá à rede da AWS.

Como planejar uma infraestrutura de rede suficiente

Para cada tarefa de transferência que você cria, gera e gerencia DataSync automaticamente a infraestrutura de rede para suas transferências de dados. Essa infraestrutura é conhecida como interfaces de rede ou interfaces de rede elásticas, que são componentes lógicos de rede em uma nuvem privada virtual (VPC) da Amazon que representam placas de rede virtuais. Para obter mais informações, consulte o Guia do usuário do Amazon EC2.

Cada interface de rede usa um único endereço IP na sub-rede VPC de destino. Para garantir que você tenha infraestrutura de rede suficiente para a migração, faça o seguinte:

  • Observe o número de interfaces de rede que DataSync serão criadas para seu local de DataSync destino.

  • Certifique-se de que sua sub-rede tenha endereços IP suficientes para suas DataSync tarefas. Por exemplo, uma tarefa que usa um atendente requer quatro endereços IP. Se você criar quatro tarefas para a migração, isso significa que você precisa de 16 endereços IP disponíveis na sub-rede.