Crie e execute uma fonte de DataZone dados da Amazon para o Amazon Redshift - Amazon DataZone

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Crie e execute uma fonte de DataZone dados da Amazon para o Amazon Redshift

Na Amazon DataZone, você pode criar uma fonte de dados do Amazon Redshift para importar metadados técnicos de tabelas e visualizações do banco de dados do armazém de dados do Amazon Redshift. Para adicionar uma fonte de DataZone dados da Amazon para o Amazon Redshift, o data warehouse de origem já deve existir no Amazon Redshift.

Ao criar e executar uma fonte de dados do Amazon Redshift, você adiciona ativos do armazém de dados de origem do Amazon Redshift ao inventário do seu projeto da DataZone Amazon. Você pode executar suas fontes de dados do Amazon Redshift em uma programação definida ou sob demanda para criar ou atualizar os metadados técnicos de seus ativos. Durante a execução da fonte de dados, você pode optar por publicar os ativos do inventário do projeto no DataZone catálogo da Amazon e, assim, torná-los detectáveis por todos os usuários do domínio. Você também pode publicar seus ativos de inventário depois de editar os metadados comerciais. Os usuários do domínio podem pesquisar e descobrir seus ativos publicados e solicitar assinaturas desses ativos.

Criar uma fonte de dados do Amazon Redshift
  1. Navegue até o URL do portal de DataZone dados da Amazon e faça login usando o single sign-on (SSO) ou suas credenciais. AWS Se você for DataZone administrador da Amazon, poderá navegar até o DataZone console da Amazon em https://console.aws.amazon.com/datazone e fazer login com o Conta da AWS local onde o domínio foi criado e, em seguida, escolher Open data portal.

  2. Escolha Selecionar projeto no painel de navegação superior e selecione o projeto ao qual você deseja adicionar a fonte de dados.

  3. Navegue até a guia Dados do projeto.

  4. No painel de navegação esquerdo, escolha Fontes de dados e, em seguida, Criar fonte de dados.

  5. Configure os campos a seguir.

    • Nome: O nome da fonte de dados.

    • Descrição: a descrição da fonte de dados.

  6. Em Tipo de fonte de dados, escolha Amazon Redshift.

  7. Em Selecionar um ambiente, especifique um ambiente no qual você quer publicar as tabelas do Amazon Redshift.

  8. Dependendo do ambiente selecionado, a Amazon DataZone aplicará automaticamente as credenciais do Amazon Redshift e outros parâmetros diretamente do ambiente ou oferecerá a opção de escolher o seu.

    • Se você selecionou um ambiente que só permite a publicação a partir do esquema padrão do Amazon Redshift do ambiente, a Amazon DataZone aplicará automaticamente as credenciais do Amazon Redshift e outros parâmetros, incluindo o nome do cluster ou grupo de trabalho, segredo, AWS nome do banco de dados e nome do esquema do Amazon Redshift. Você não pode editar esses parâmetros preenchidos automaticamente.

    • Se você selecionar um ambiente que não permita a publicação de dados, não poderá continuar com a criação da fonte de dados.

    • Se você selecionar um ambiente que permita a publicação de dados de qualquer esquema, você verá a opção de usar as credenciais e outros parâmetros do Amazon Redshift do ambiente ou inserir suas próprias credenciais/parâmetros.

  9. Se você optar por usar suas próprias credenciais para criar a fonte de dados, forneça os seguintes detalhes:

    • Em Fornecer credenciais do Amazon Redshift, escolha se deseja usar um cluster provisionado do Amazon Redshift ou um espaço de trabalho do Amazon Redshift sem servidor como sua fonte de dados.

    • Dependendo da sua seleção na etapa acima, escolha seu cluster ou espaço de trabalho do Amazon Redshift no menu suspenso e, em seguida, escolha o segredo no Secrets Manager a ser usado para AWS autenticação. É possível escolher um segredo existente ou criar um novo.

    • Para que o segredo existente apareça no menu suspenso, certifique-se de que seu segredo no AWS Secrets Manager inclua as seguintes tags (chave/valor):

      • AmazonDataZoneProject: <projectID>

      • AmazonDataZoneDomain: <domainID>

      Se você optar por criar um novo segredo, o segredo será automaticamente marcado com as tags mencionadas acima e nenhuma etapa extra será necessária. Para obter mais informações, consulte Armazenamento de credenciais de banco de dados em AWS Secrets Manager.

      Os usuários do Amazon Redshift no AWS segredo fornecido para criar a fonte de dados devem ter SELECT permissões nas tabelas que serão publicadas. Se você quiser que DataZone a Amazon também gerencie as assinaturas (acesso) em seu nome, os usuários do banco de dados no AWS segredo também devem ter as seguintes permissões:

      • CREATE DATASHARE

      • ALTER DATASHARE

      • DROP DATASHARE

  10. Em Seleção de dados, forneça um banco de dados e um esquema do Amazon Redshift e insira seus critérios de seleção de tabela ou visualização. Por exemplo, se você escolher Incluir e inserir *corporate, o ativo incluirá todas as tabelas de origem que terminam com a palavra corporate.

    Você pode adicionar várias regras de inclusão para tabelas dentro de um único banco de dados. Você também pode adicionar vários bancos de dados usando o botão Adicionar outro banco de dados.

  11. Escolha Próximo.

  12. Em Configurações de publicação, escolha se os ativos podem ser imediatamente descobertos no catálogo de dados. Se você adicioná-los apenas ao inventário, poderá escolher os termos de assinatura posteriormente e publicá-los no catálogo de dados corporativos.

  13. Para Geração automatizada de nomes comerciais, escolha se deseja gerar automaticamente metadados para ativos à medida que eles são publicados e atualizados a partir da fonte.

  14. (Opcional) Para formulários de metadados, adicione formulários para definir os metadados que são coletados e salvos quando os ativos são importados para a Amazon. DataZone Para obter mais informações, consulte Crie um formulário de metadados na Amazon DataZone.

  15. Em Preferência de execução, escolha quando executar a fonte de dados.

    • Executar em uma programação: especifique as datas e a hora de execução da fonte de dados.

    • Executar sob demanda: você pode iniciar manualmente as execuções da fonte de dados.

  16. Escolha Próximo.

  17. Revise sua configuração da fonte de dados e escolha Criar.

nota

Quando uma fonte de dados do Amazon Redshift é criada, a Amazon DataZone concede acesso “somente de leitura” ao ambiente usado para criar a fonte de dados para acessar todas as tabelas nos esquemas do Amazon Redshift usados na fonte de dados. Você pode monitorar o status dessas concessões em fontes de dados na página de detalhes do seu ambiente.

Ao usar um cluster do Amazon Redshift ou um grupo de trabalho sem servidor diferente daquele usado para criar o ambiente, você deve garantir que a seguinte AWS tag seja adicionada ao cluster ou grupo de trabalho. Isso é necessário para que os usuários do ambiente possam visualizar o banco de dados concedido no Editor de Consultas V2 do Amazon Redshift: DataZoneDiscoverable_${domainId}: true

Para os ambientes criados antes da versão atual da Amazon DataZone, os membros do projeto não poderão ver as tabelas concedidas no Amazon Redshift.