Criação de um caderno no EMR Studio - Amazon EMR

Criação de um caderno no EMR Studio

nota

Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão Criar Workspace no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console e console do Amazon EMR.

Você cria um Caderno do EMR usando o console antigo do Amazon EMR. Não há suporte para a criação de cadernos usando a AWS CLI ou a API do Amazon EMR.

Para criar um notebook do EMR
  1. Abra o console do Amazon EMR em https://console.aws.amazon.com/elasticmapreduce/.

  2. Escolha Notebooks (Blocos de anotações, Create notebook (Criar bloco de anotações).

  3. Insira um Notebook name (Nome do bloco de anotações) e uma Notebook description (Descrição do bloco de anotações) adicional.

  4. Se você tiver um cluster ativo ao qual deseja anexar o caderno, deixe o padrão Escolher um cluster existente selecionado, clique em Escolher, selecione um cluster na lista e, em seguida, clique em Escolher cluster. Para obter informações sobre os requisitos de cluster para Cadernos do EMR, consulte Requisitos, diferenças nas versões de lançamento e segurança para cadernos do EMR.

    —ou—

    Escolha Criar um cluster, insira um Nome de cluster e escolha opções de acordo com as diretrizes a seguir. O cluster é criado na VPC padrão para a conta usando instâncias sob demanda.

    Configuração Descrição

    Nome do cluster

    O nome amigável usado para identificar o cluster.

    Versão

    Não pode ser modificado. O padrão é a versão mais recente do Amazon EMR (5.36.2).

    Aplicações

    Não pode ser modificado. Lista os aplicativos instalados no cluster.

    Instância

    Insira o número de instâncias e selecione o tipo de instância do EC2. Uma instância é usada para o nó primário. O resto é usado para nós core. O tipo de instância determina o número de blocos de anotações que podem ser anexados ao cluster simultaneamente. Para obter mais informações, consulte Limites para Cadernos do EMR anexados simultaneamente.

    Função do EMR

    Deixe o padrão ou escolha o link para especificar um perfil de serviço personalizado para o Amazon EMR. Para obter mais informações, consulte Perfil de serviço para Amazon EMR (perfil do EMR).

    Perfil de instância do EC

    Deixe o padrão ou escolha o link para especificar uma função de serviço personalizada para instâncias do EC2. Para obter mais informações, consulte Perfil de serviço para instâncias do EC2 do cluster (perfil de instância do EC2).

    EC2 key pair

    Escolha um par de chaves do EC2 para poder se conectar a instâncias de cluster. Para obter mais informações, consulte Como se conectar ao nó primário do cluster do Amazon EMR usando SSH.

    Encerramento automático O encerramento automático é compatível com as versões 5.30.0 e 6.1.0 e posteriores do Amazon EMR.

    Marque a caixa de seleção para habilitar o encerramento automático e, em seguida, especifique o tempo de inatividade após o qual o cluster deverá ser desligado automaticamente. Para obter mais informações, consulte Uso de uma política de encerramento automático para limpeza de cluster do Amazon EMR.

  5. Em Security groups (Grupos de segurança), escolha Use default security groups (Usar grupos de segurança padrão). Como alternativa, escolha Escolher grupos de segurança e selecione grupos de segurança personalizados que estão disponíveis na VPC do cluster. Selecione um grupo para a instância primária e outro para a instância do cliente do caderno. Para obter mais informações, consulte Especificar grupos de segurança do EC2 para Cadernos do EMR.

  6. Em Perfil de serviço da AWS, deixe o padrão ou escolha um perfil personalizado na lista. A instância do cliente do bloco de anotações usa essa função. Para obter mais informações, consulte Perfil de serviço para Cadernos do EMR.

  7. Em Local do caderno, escolha o local no Amazon S3 no qual o arquivo de caderno será salvo ou especifique seu próprio local. Se o bucket e a pasta não existirem, o Amazon EMR os criará.

    O Amazon EMR cria uma pasta com o ID do caderno como nome da pasta e salva o caderno em um arquivo chamado NotebookName.ipynb. Por exemplo, se você especificar o local do Amazon S3 s3://amzn-s3-demo-bucket/MyNotebooks para um caderno chamado MyFirstEMRManagedNotebook, o arquivo de caderno será salvo em s3://amzn-s3-demo-bucket/MyNotebooks/NotebookID/MyFirstEMRManagedNotebook.ipynb.

    Se você especificar um local criptografado no Amazon S3, deverá configurar o Perfil de serviço para Cadernos do EMR como um usuário da chave. A função de serviço padrão é EMR_Notebooks_DefaultRole. Se você estiver usando uma chave do AWS KMS para criptografia, consulte Using key policies in AWS KMS no Guia do desenvolvedor do AWS Key Management Service e o artigo de suporte para adicionar usuários da chave.

  8. Como opção, se você adicionou um repositório baseado em Git ao Amazon EMR que deseja associar a este caderno, escolha Repositório Git, selecione Escolher repositório e, em seguida, escolha um repositório na lista. Para obter mais informações, consulte Associação de repositórios baseados em Git a Cadernos do EMR.

  9. Opcionalmente, selecione Tags e, em seguida, adicione as tags de chave-valor adicionais para o bloco de anotações.

    Importante

    Uma tag padrão com a string Key (Chave) definida como creatorUserID e o valor definido como o ID de usuário do IAM são aplicados para fins de acesso. Recomendamos que você não altere nem remova essa tag, pois ela pode ser usada para controlar o acesso. Para obter mais informações, consulte Usar etiquetas de caderno e cluster com as políticas de controle de acesso do IAM.

  10. Selecione Criar bloco de anotações.