Criar um trabalho de ETL usando cadernos no AWS Glue Studio
Para começar a usar cadernos no console do AWS Glue Studio
-
Anexe políticas do AWS Identity and Access Management ao usuário AWS Glue Studio e crie um perfil do IAM para seu trabalho de ETL e bloco de anotações.
-
Configure a segurança adicional do IAM para cadernos, conforme descrito em Conceder permissões para a função do IAM.
-
Abra o console do AWS Glue Studio em https://console.aws.amazon.com/gluestudio/
. nota
Verifique se o navegador não bloqueia cookies de terceiros. Qualquer navegador que bloqueie cookies de terceiros por padrão ou graças a uma configuração habilitada pelo usuário impedirá a inicialização dos cadernos. Para mais informações sobre o gerenciamento de cookies, consulte:
-
Escolha o link Jobs (Trabalhos) no menu de navegação do lado esquerdo.
-
Escolha Jupyter Notebook (Caderno do Jupyter) e, em seguida, escolha Create (Criar) para iniciar uma nova sessão de caderno.
-
Na página Create job in Jupyter notebook (Criar trabalho em caderno do Jupyter), forneça o nome do trabalho e escolha a função do IAM a ser usada. Escolha Criar trabalho.
Após um curto período de tempo, o editor de caderno é mostrado.
-
Após adicionar o código, execute a célula para iniciar uma sessão. Há várias maneiras de executar a célula:
Pressione o botão play (reproduzir).
-
Use o atalho de teclado:
-
No macOS, Command+Enter para executar a célula.
-
No Windows, Shift+Enter para executar a célula.
-
Para obter informações sobre como escrever código usando uma interface do caderno do Jupyter, consulte a Documentação do usuário do Jupyter Notebook
. -
Para testar seu script, execute o script inteiro ou células individuais. Qualquer saída de comando será exibida na área abaixo da célula.
-
Após concluir o desenvolvimento de seu caderno, você poderá salvar o trabalho e executá-lo. Você encontrará o script na guia Script. Qualquer mágica adicionada ao caderno será removida e não será salva como parte do script do trabalho gerado do AWS Glue. O AWS Glue Studio adicionará automaticamente um
job.commit()ao final do script gerado com base no conteúdo do caderno.Para obter mais informações sobre como executar trabalhos, consulte Iniciar uma execução de trabalho.