As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurar transferências AWS DataSync com o Google Cloud Storage
Com o AWS DataSync, você pode transferir dados entre o Google Cloud Storage e os seguintes serviços de armazenamento da AWS:
-
Amazon S3
-
Amazon EFS
-
Amazon FSx for Windows File Server
-
Amazon FSx para Lustre
-
Amazon FSx para OpenZFS
-
Amazon FSx for NetApp ONTAP
Para começar a configuração da transferência, crie um local para o Google Cloud Storage. Esse local pode servir como origem ou destino da transferência. Um atendente do DataSync é exigido somente quando você transfere dados entre o Google Cloud Storage e o Amazon EFS ou o Amazon FSx, ou ao usar tarefas do modo Básico. As transferências de dados no modo Avançado entre o Google Cloud Storage e o Amazon S3 não exigem um atendente.
nota
Para conectividade de nuvem privada entre o Google Cloud Storage eAWS, use o modo Básico com atendentes.
Visão geral
O DataSync usa a API XML do Google Cloud Storage
Ao usar o modo Básico para transferências, você pode implantar o atendente no Google Cloud Storage ou na Amazon VPC.
Custos
As taxas associadas a essa migração podem incluir:
-
Executar uma instância de máquina virtual (VM) do Google Compute Engine
(se você implantar seu agente do DataSync no Google Cloud) -
Executar uma instância do Amazon EC2
(se você implantar seu agente do DataSync em uma VPC dentro do AWS) -
Transferir os dados usando o DataSync
, incluindo cobranças de solicitações relacionadas ao Google Cloud Storage e ao Amazon S3 (se o S3 for um dos seus locais de transferência) -
Transferindo dados para fora do Google Cloud Storage
-
Armazenando dados no Amazon S3
Pré-requisitos
Antes de começar, faça o seguinte, se já não o tiver feito:
-
Crie um bucket do Google Cloud Storage
com os objetos para os quais você quer transferir AWS. -
Crie um bucket do Amazon S3 para armazenar seus objetos depois que eles entrarem no AWS.
Criar uma chave HMAC para seu bucket do Google Cloud Storage
O DataSync usa uma chave HMAC associada à sua conta de serviço do Google para se autenticar com e ler o bucket do qual você está transferindo dados. (Para obter instruções detalhadas sobre como criar chaves HMAC, consulte a Documentação do Google Cloud Storage
Para criar uma chave HMAC
-
Crie uma chave HMAC para sua conta de serviço do Google.
-
Certifique-se de que sua conta de serviço do Google tenha pelo menos
Storage Object Viewerpermissões. -
Salve o ID da chave de acesso HMAC e o segredo em um local seguro.
Você precisará desses itens mais tarde para configurar o local de origem do DataSync.
Etapa 2: configure sua rede
A configuração de rede é exigida somente ao usar um atendente do DataSync com a transferência. Os requisitos de rede para essa migração dependem de onde você escolher implantar o atendente.
Se você quiser hospedar seu agente do DataSync no Google Cloud, configure sua rede para allow DataSync transfers through a public endpoint (permitir transferências do DataSync por meio de um endpoint público).
Se você quiser hospedar seu agente em AWS, você precisará de uma VPC com um endpoint de interface. O DataSync usa o endpoint da VPC para facilitar a transferência.
Para configurar sua rede para um endpoint da VPC
-
Se você não tiver uma, crie uma VPC no mesmo Região da AWS que o bucket do S3.
-
Crie um endpoint de serviço da VPC para o DataSync.
-
Configure sua rede para permitir transferências do DataSync por um endpoint da VPC.
Para fazer isso, modifique o grupo de segurança associado com seu endpoint de serviço da VPC.
Etapa 3: crie um atendente do DataSync (opcional)
Um atendente do DataSync é exigido apenas ao usar tarefas do modo Básico. Se você estiver usando o modo Avançado para transferir entre o Google Cloud Storage (GCS) e o Amazon S3, nenhum atendente será exigido. Se você quiser usar o modo Básico, precisará de um atendente do DataSync que possa acessar o bucket do GCS.
Nesse cenário, o agente do DataSync é executado em seu ambiente do Google Cloud.
Antes de começar: instale a CLI do Google Cloud
Para criar o agente para o Google Cloud
-
Abra o console AWS DataSync em https://console.aws.amazon.com/datasync/
. -
No painel de navegação à esquerda, escolha Agents e Create agent.
-
Para Hypervisor, escolha VMware ESXi e, em seguida, escolha Baixar a imagem para baixar um arquivo
.zipque contém o agente. -
Abra um terminal do . Descompacte a imagem executando o seguinte comando:
unzip AWS-DataSync-Agent-VMWare.zip -
Extraia o conteúdo do arquivo
.ovado agente, começando comaws-datasync, executando o seguinte comando:tar -xvf aws-datasync-2.0.1655755445.1-x86_64.xfs.gpt.ova -
Importe o arquivo
.vmdkdo agente para o Google Cloud executando o seguinte comando da CLI do Google Cloud:gcloud compute images import aws-datasync-2-test \ --source-file INCOMPLETE-aws-datasync-2.0.1655755445.1-x86_64.xfs.gpt-disk1.vmdk \ --os centos-7nota
A importação do arquivo
.vmdkpode levar até duas horas. -
Crie e inicie uma instância de VM para a imagem do agente que você acabou de importar.
A instância precisa das seguintes configurações para seu agente. (Para obter instruções detalhadas sobre como criar uma instância, consulte a Documentação do Google Cloud Compute Engine
). -
Em Machine type (Tipo de máquina), selecione uma das seguintes opções:
-
e2-standard-8: para execuções de tarefas do DataSync trabalhando com até 20 milhões de objetos.
-
e2-standard-16: para execuções de tarefas do DataSync trabalhando com mais de 20 milhões de objetos.
-
-
Para as configurações de inicialização do disco, acesse a seção de imagens personalizadas. Em seguida, escolha a imagem do agente do DataSync que você acabou de importar.
-
Para a configuração da conta de serviço, escolha sua conta de serviço do Google (a mesma conta que você usou na Etapa 1).
-
Para a configuração do firewall, escolha a opção para permitir o tráfego HTTP (porta 80).
Para ativar seu agente do DataSync, a porta 80 deve estar aberta no agente. A porta não precisa ser acessível publicamente. Depois de ativado, o DataSync fecha a porta.
-
-
Depois que a instância de VM estiver em execução, anote seu endereço IP público.
Você precisará desse endereço IP para ativar o agente.
-
Retorne ao console do DataSync. Na tela Criar agente, na qual você baixou a imagem do agente, faça o seguinte para ativar seu agente:
-
Para Tipo de endpoint, escolha a opção de endpoints de serviço público (por exemplo, Endpoints de serviço público no leste dos EUA em Ohio).
-
Em Chave de ativação, escolha Obter a chave de ativação com o seu agente automaticamente.
-
Em Endereço do agente, insira o endereço IP público da instância de VM do agente que você acabou de criar.
-
Escolha Obter chave.
-
-
Dê um nome ao seu agente e, em seguida, escolha Criar agente.
O agente está online e pronto para transferir dados.
Nesse cenário, o agente é executado como uma instância do Amazon EC2 em uma VPC associada à sua Conta da AWS.
Antes de começar: configure o AWS Command Line Interface (AWS CLI).
Para criar o agente para sua VPC
-
Abra um terminal do . Certifique-se de configurar seu perfil AWS CLI para usar a conta associada ao seu bucket do S3.
-
Copie o seguinte comando: Substitua
pelo Região da AWS onde sua VPC reside (por exemplo,vpc-regionus-east-1).aws ssm get-parameter --name /aws/service/datasync/ami --regionvpc-region -
Execute o comando . Examine o resultado e anote a propriedade
"Value".Esse valor é o ID do DataSync da Imagem de máquina da Amazon (AMI) da região que você especificou. Por exemplo, uma ID de AMI pode ser semelhante a
ami-1234567890abcdef0. -
Copie o seguinte URL. Novamente, substitua
pelo Região da AWS onde sua VPC reside. Depois, substituavpc-regionpelo ID da AMI que você anotou na etapa anterior.ami-idhttps://console.aws.amazon.com/ec2/v2/home?region=vpc-region#LaunchInstanceWizard:ami=ami-id -
Cole o URL no navegador.
A página de lançamento da instância do Amazon EC2 no Console de gerenciamento da AWS é exibida.
-
Em Tipo de instância, selecione uma das Instâncias recomendadas do Amazon EC2 para agentes do DataSync.
-
Em Par de chaves, escolha um par de chaves existente ou crie outro.
-
Em Configurações de rede, escolha a VPC e a sub-rede em que você deseja implantar o agente.
-
Escolha Iniciar instância.
-
Depois que a instância do Amazon EC2 estiver em execução, escolha o endpoint da VPC.
Etapa 4: crie um local de origem do DataSync para seu bucket do Google Cloud Storage
Para configurar um local do DataSync para seu bucket do Google Cloud Storage, você precisa do ID de acesso e o segredo da chave HMAC que você criou na Etapa 1.
Para criar o local de origem do DataSync
Abra o AWS DataSync console do em https://console.aws.amazon.com/datasync/
. No painel de navegação esquerdo, expanda Transferência de dados e escolha Locais e Criar local.
-
Em Tipo de localização, escolha Armazenamento de objetos.
-
Em Servidor, insira
storage.googleapis.com. -
Em Nome do bucket, insira o nome do seu bucket do Google Cloud Storage.
-
Em Pasta, insira um prefixo de objeto.
O DataSync copia apenas objetos com esse prefixo.
-
Se a transferência exigir um atendente, escolha Usar atendentes e escolha o atendente que você criou na Etapa 3.
-
Expanda Configurações adicionais. Para Protocolo de servidor, escolha HTTPS. Em Porta do servidor, escolha 443.
-
Role para baixo até a seção Autenticação. Verifique se a caixa de seleção Exige credenciais está marcada e faça o seguinte:
-
Em Chave de acesso, insira o ID de acesso da sua chave HMAC.
-
Em Chave secreta, insira a chave secreta da chave HMAC diretamente ou especifique um segredo do AWS Secrets Manager que contenha a chave. Para obter mais informações, consulte Como fornecer credenciais para locais de armazenamento.
-
-
Escolha Criar local.
Etapa 5: crie um local de destino do DataSync para seu bucket do S3
Você precisa de um local do DataSync para onde você deseja que seus dados vão.
Para criar o local de destino do DataSync
Abra o AWS DataSync console do em https://console.aws.amazon.com/datasync/
. No painel de navegação esquerdo, expanda Transferência de dados e escolha Locais e Criar local.
-
Crie um local no DataSync para o bucket do S3.
Se você implantou o agente do DataSync em sua VPC, este tutorial presume que o bucket do S3 esteja no mesmo Região da AWS que sua VPC e seu agente do DataSync.
Etapa 6: crie e inicie uma tarefa no DataSync
Com seus locais de origem e destino configurados, você pode começar a mover seus dados para AWS.
Para criar e iniciar a tarefa no DataSync
Abra o console do AWS DataSync em https://console.aws.amazon.com/datasync/
. No painel de navegação esquerdo, expanda Transferência de dados, escolha Tarefas e, em seguida, escolha Criar tarefa.
-
Na página Configure source location (Configurar local de origem), faça o seguinte:
-
Escolha Choose an existing location (Escolher um local existente).
-
Escolha o local de origem que você criou na Etapa 4 e, em seguida, escolha Next (Avançar).
-
-
Na página Configure destination location (Configurar local de destino), faça o seguinte:
-
Escolha Choose an existing location (Escolher um local existente).
-
Escolha o local de destino que você criou na Etapa 5 e, em seguida, escolha Next (Avançar).
-
-
Na página Configure settings (Configurar definições), faça o seguinte:
-
Em Data transfer configuration (Configuração de transferência de dados), expanda Additional settings (Configurações adicionais) e desmarque a caixa de seleção Copy object tags (Copiar tags de objetos).
Importante
Como a API XML do Google Cloud Storage não é compatível com leitura ou gravação de tags de objeto, a tarefa do DataSync poderá falhar se você tentar copiar tags de objeto.
-
Defina todas as outras configurações de tarefa desejadas e, em seguida, escolha Next (Avançar).
-
-
Na página Review (Revisar), revise suas configurações e, em seguida, escolha Criar tarefa.
-
Na página de detalhes da tarefa, escolha Iniciar e, em seguida, escolha uma das seguintes opções:
-
Para executar a tarefa sem modificação, escolha Iniciar com padrões.
-
Para modificar a tarefa antes de executá-la, escolha Iniciar com opções substitutas.
-
Quando sua tarefa terminar, você verá os objetos do seu bucket do Google Cloud Storage no seu bucket do S3.