As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Como acelerar a migração com o particionamento de dados
Com uma migração de grande porte, recomendamos particionar o conjunto de dados com várias tarefas do DataSync. Particionar os dados de origem em várias tarefas (e possivelmente em atendentes) permite paralelizar as transferências e reduzir a linha do tempo da migração.
O particionamento também ajuda você a permanecer dentro das cotas do DataSync e simplifica o monitoramento e a depuração das tarefas.
O diagrama a seguir mostra como você pode usar várias tarefas e atendentes do DataSync para transferir dados do mesmo local de armazenamento de origem. Nesse cenário, cada tarefa se concentra em uma pasta específica no local de origem. Para obter mais informações e exemplos sobre essas abordagens, consulte Como acelerar as transferências de dados com arquiteturas para aumentar a escala horizontalmente do AWS DataSync
Como particionar o conjunto de dados por pasta ou prefixo
Ao criar o local de origem do DataSync, você pode especificar uma pasta, diretório ou prefixo do qual o DataSync lê. Por exemplo, se você estiver migrando um compartilhamento de arquivos com diretórios de nível superior, poderá criar vários locais que especificam um caminho de diretório diferente. Em seguida, você pode usar esses locais para executar várias tarefas do DataSync durante a migração.
Como particionar o conjunto de dados com filtros
Você pode aplicar filtros para incluir ou excluir dados do local de origem em uma transferência No contexto de uma migração de grande porte, os filtros podem ajudar você a definir o escopo das tarefas para partes específicas do conjunto de dados.
Por exemplo, se você estiver migrando dados de arquivamento organizados por ano, poderá criar um filtro de inclusão que corresponda a um ano específico ou a vários anos. Você também pode modificar o filtro sempre que executar a tarefa para corresponder a um ano diferente.
Como particionar o conjunto de dados com manifestos
Um manifesto é uma lista de arquivos ou objetos que você deseja que o DataSync transfira. Com um manifesto, o DataSync não precisa ler tudo em um local de origem para determinar o que transferir.
Você pode criar manifestos com base em inventários do armazenamento de origem ou por meio de abordagens orientadas a eventos (por exemplo, consulte Como implementar o AWS DataSync com centenas de milhões de objetos