

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Associação de repositórios baseados em Git a Cadernos do EMR
<a name="emr-git-repo"></a>

Você pode associar repositórios baseados em Git aos Cadernos do Amazon EMR para salvá-los em um ambiente com versão controlada. É possível associar até três repositórios a um bloco de anotações. Os seguintes serviços baseados em GIT são compatíveis:
+ [AWS CodeCommit](https://aws.amazon.com/codecommit)
+ [GitHub](https://www.github.com)
+ [Bitbucket](https://bitbucket.org/)
+ [GitLab](https://about.gitlab.com/)

**nota**  
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão **Criar Workspace** no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte [Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) e [console do Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

Associar repositórios baseados em GIT ao bloco de anotações tem os seguintes benefícios.
+ **Controle de versão**: é possível registrar alterações de código em um sistema com controle de versão para poder analisar o histórico de alterações e revertê-las seletivamente.
+ **Colaboração**: colegas que trabalham em diferentes cadernos podem compartilhar códigos por meio de repositórios remotos baseados em Git. Os blocos de anotações podem clonar ou mesclar código de repositórios remotos e retornar as alterações para esses repositórios remotos.
+ **Reutilização de código** — Muitos notebooks Jupyter que demonstram técnicas de análise de dados ou aprendizado de máquina estão disponíveis em repositórios hospedados publicamente, como. GitHub É possível associar os blocos de anotações a um repositório para reutilizar os blocos de anotações Jupyter contidos em um repositório.

Para usar repositórios baseados em Git com Cadernos do EMR, adicione os repositórios como recursos no console do Amazon EMR, associe credenciais para os repositórios que requerem autenticação e vincule-os aos seus cadernos. É possível visualizar uma lista de repositórios armazenados em sua conta e detalhes sobre cada repositório no console do Amazon EMR. Você pode associar um repositório baseado em GIT existente a um bloco de anotações ao criá-lo. 

**Topics**
+ [Pré-requisitos e considerações ao integrar um caderno do EMR a um repositório](emr-managed-notebooks-git-considerations.md)
+ [Adição de um repositório baseado em Git ao Amazon EMR](emr-git-repo-add.md)
+ [Atualização ou exclusão de um repositório baseado em Git de um Workspace do EMR Studio](emr-git-repo-delete.md)
+ [Vinculação ou desvinculação de um repositório baseado em Git no EMR Studio](emr-git-repo-link.md)
+ [Criação de um caderno com um repositório Git associado no EMR Studio](emr-git-repo-create-notebook.md)
+ [Uso de repositórios Git em um caderno do EMR Studio](emr-git-repo-open.md)

# Pré-requisitos e considerações ao integrar um caderno do EMR a um repositório
<a name="emr-managed-notebooks-git-considerations"></a>

Considere as práticas recomendadas a seguir em relação a confirmações, permissões e hospedagem ao planejar a integração de um repositório baseado em Git com cadernos do EMR.

**nota**  
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão **Criar Workspace** no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte [Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) e [console do Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

## AWS CodeCommit
<a name="code-commit-considerations"></a>

Se você usa um CodeCommit repositório, deve usar as credenciais do Git e o HTTPS com. CodeCommit Chaves SSH e HTTPS com o auxiliar de AWS CLI credenciais não são compatíveis. CodeCommit não suporta tokens de acesso pessoal (PATs). *Para obter mais informações, consulte Como [usar o IAM com CodeCommit: credenciais do Git, chaves SSH e chaves de AWS acesso](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_credentials_ssh-keys.html) no *Guia do usuário do IAM* e [Configuração para usuários de HTTPS usando credenciais do Git](https://docs.aws.amazon.com/codecommit/latest/userguide/setting-up-gc.html) no Guia do usuário.AWS CodeCommit *

## Considerações sobre acesso e permissão
<a name="access-considerations"></a>

Antes de associar um repositório ao seu caderno, certifique-se de que o cluster, o perfil do IAM para Cadernos do EMR e os grupos de segurança tenham as configurações e as permissões corretas. Você também pode configurar repositórios baseados em Git hospedados em uma rede privada ao seguir as instruções em [Configuração de um repositório Git hospedado de forma privada para Cadernos do EMR](#emr-managed-notebooks-private-git-repo).
+ **Acesso à Internet do cluster**: a interface de rede iniciada tem somente um endereço IP privado. Isso significa que o cluster ao qual o bloco de anotações se conecta deve estar em uma sub-rede privada com um gateway de conversão de endereço de rede (NAT) ou deve ser capaz de acessar a Internet por um gateway privado virtual. Para obter mais informações, consulte [Amazon VPC options](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-clusters-in-a-vpc.html).

  Os grupos de segurança do bloco de anotações devem incluir uma regra de saída que permita ao bloco de anotações rotear tráfego para a Internet por meio do cluster. Recomendamos que você crie seus próprios grupos de segurança. Para obter mais informações, consulte [Specifying EC2 security groups for EMR Notebooks](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-security-groups.html).
**Importante**  
Se a interface de rede for inicializada em uma sub-rede pública, não será possível ter uma comunicação com a Internet através de um gateway da Internet (IGW).
+ **Permissões para AWS Secrets Manager** — Se você usa o Secrets Manager para armazenar segredos usados para acessar um repositório, ele [Perfil de serviço para Cadernos do EMR](emr-managed-notebooks-service-role.md) deve ter uma política de permissões anexada que permita a `secretsmanager:GetSecretValue` ação.

## Configuração de um repositório Git hospedado de forma privada para Cadernos do EMR
<a name="emr-managed-notebooks-private-git-repo"></a>

Use as instruções apresentadas a seguir para configurar repositórios hospedados de forma privada para Cadernos do EMR. Você deve fornecer um arquivo de configuração com informações sobre os servidores DNS e Git. O Amazon EMR usa essas informações para configurar Cadernos do EMR que podem rotear o tráfego para seus repositórios hospedados de forma privada.

**Pré-requisitos**

Antes de configurar um repositório Git hospedado de forma privada para Cadernos do EMR, você deve ter o seguinte:
+ Um Amazon S3 Control local onde os arquivos do seu notebook EMR serão salvos.

**Configurar um ou mais repositórios Git hospedados de forma privada para Cadernos do EMR**

1. Crie um arquivo de configuração usando o modelo fornecido. Inclua os seguintes valores para cada servidor Git que deseja especificar em sua configuração:
   + **`DnsServerIpV4`**- O IPv4 endereço do seu servidor DNS. Se você fornecer valores para `DnsServerIpV4` e `GitServerIpV4List`, o valor para `DnsServerIpV4` terá precedência e será usado para resolver seu `GitServerDnsName`.
**nota**  
Para usar repositórios Git hospedados de forma privada, seu servidor DNS deve permitir o acesso de entrada de Cadernos do EMR. Recomendamos fortemente proteger o servidor DNS contra outros acessos não autorizados.
   + **`GitServerDnsName`**: o nome DNS do seu servidor Git. Por exemplo, `"git.example.com"`.
   + **`GitServerIpV4List`**- Uma lista de IPv4 endereços que pertencem ao (s) seu (s) servidor (es) Git.

   ```
   [
       {
           "Type": "PrivatelyHostedGitConfig",
           "Value": [
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<enterprise.git.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               },
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<git.example.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               }
           ]
       }
   ]
   ```

1. Salve seu arquivo de configuração como `configuration.json`.

1. Faça o upload do arquivo de configuração no local de armazenamento designado do Amazon S3 em uma pasta chamada `life-cycle-configuration`. Por exemplo, se o local padrão do S3 for `s3://amzn-s3-demo-bucket/notebooks`, seu arquivo de configuração deverá estar localizado em `s3://amzn-s3-demo-bucket/notebooks/life-cycle-configuration/configuration.json`.
**Importante**  
Recomendamos fortemente restringir o acesso à pasta `life-cycle-configuration` somente para os administradores dos Cadernos do EMR e para o perfil de serviço dos Cadernos do EMR. Você também deve proteger `configuration.json` contra acesso não autorizado. Para obter instruções, consulte [Controlar o acesso a um bucket com políticas de usuário](https://docs.aws.amazon.com/AmazonS3/latest/userguide/walkthrough1.html) ou [Práticas recomendadas de segurança para o Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/security-best-practices.html).

   Para obter instruções sobre como fazer o upload, consulte [Criar uma pasta](https://docs.aws.amazon.com/AmazonS3/latest/userguide/using-folders.html#create-folder) e [Fazer upload de objetos](https://docs.aws.amazon.com/AmazonS3/latest/userguide/upload-objects.html) no *Guia do usuário do Amazon Simple Storage Service*.

# Adição de um repositório baseado em Git ao Amazon EMR
<a name="emr-git-repo-add"></a>

Consulte as seções a seguir para obter informações sobre como adicionar um repositório baseado em Git a um Caderno do EMR no console antigo ou a um Workspace do EMR Studio no console.

**nota**  
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão **Criar Workspace** no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte [Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) e [console do Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

------
#### [ Console ]

Como os Cadernos do EMR são Workspaces do EMR Studio no novo console, você pode seguir as instruções em [Vinculação de repositórios baseados em Git a um Workspace do EMR Studio](emr-studio-git-repo.md) para associar, no máximo, três repositórios Git ao seu Workspace.

Como alternativa, você pode usar a extensão JupyterLab Git. Escolha o ícone **Git** na barra lateral esquerda do seu caderno JupyterLab para acessar a extensão. Para obter informações sobre a extensão, consulte o repositório [ GitHub jupyterlab-git](https://github.com/jupyterlab/jupyterlab-git).

Para associar um repositório Git a um Workspace, o administrador do Studio deve seguir etapas para configurar o Studio para permitir a vinculação do repositório Git. Para obter mais informações, consulte [Estabelecimento de acesso e de permissões para repositórios baseados em Git](emr-studio-enable-git.md).

------

# Atualização ou exclusão de um repositório baseado em Git de um Workspace do EMR Studio
<a name="emr-git-repo-delete"></a>

Consulte as seções a seguir para obter informações sobre como excluir um repositório baseado em Git de um Caderno do EMR no console antigo ou de um Workspace do EMR Studio no console.

**nota**  
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão **Criar Workspace** no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte [Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) e [console do Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

------
#### [ Console ]

Como os Cadernos do EMR são Workspaces do EMR Studio no novo console, você pode consultar [Vinculação de repositórios baseados em Git a um Workspace do EMR Studio](emr-studio-git-repo.md) para obter mais informações sobre como trabalhar com repositórios do Git em seu Workspace. Mas, neste momento, não é possível excluir repositórios do Git do Workspaces.

------

# Vinculação ou desvinculação de um repositório baseado em Git no EMR Studio
<a name="emr-git-repo-link"></a>

Use as etapas a seguir para vincular ou desvincular um repositório baseado em Git a um Caderno do EMR no console antigo ou a um Workspace do EMR Studio no console.

**nota**  
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão **Criar Workspace** no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte [Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) e [console do Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

------
#### [ Console ]

Como os Cadernos do EMR são Workspaces do EMR Studio no novo console, você pode consultar [Vinculação de repositórios baseados em Git a um Workspace do EMR Studio](emr-studio-git-repo.md) para obter mais informações sobre como trabalhar com repositórios do Git em seu Workspace. Mas, neste momento, não é possível excluir repositórios do Git do Workspaces.

------

## Noções básicas sobre o status do repositório
<a name="emr-managed-notebooks-repository-status"></a>

Um repositório Git pode ter qualquer um dos status a seguir na lista de repositórios. Para obter mais informações sobre como vincular o EMR Notebooks a repositórios do Git, consulte [Vinculação ou desvinculação de um repositório baseado em Git no EMR Studio](#emr-git-repo-link).


| Status | Significado | 
| --- | --- | 
|  Linking (Vinculando)  |  O repositório do Git está sendo vinculado ao bloco de anotações. Enquanto o repositório estiver **Linking (Vinculando)**, não será possível interromper o bloco de anotações.  | 
|  Linked (Vinculado)  |  O repositório do Git está vinculado ao bloco de anotações. Enquanto o repositório tiver um status **Linked (Vinculado)** ele estará conectado ao repositório remoto.  | 
|  Link Failed (Falha ao vincular)  |  Ocorreu uma falha ao vincular o repositório do Git ao bloco de anotações. Você pode tentar vinculá-los novamente.  | 
|  Unlinking (Desvinculando)  |  O repositório do Git está sendo desvinculado do bloco de anotações. Enquanto o repositório estiver **Unlinking (Desvinculando)**, não será possível interromper o bloco de anotações. Desvincular um repositório do Git de um bloco de anotações apenas o desconecta do repositório remoto; isso não exclui nenhum código do bloco de anotações.  | 
|  Unlink Failed (Falha ao desvincular)  |  Ocorreu uma falha ao desvincular o repositório do Git do bloco de anotações. Você pode tentar desvinculá-los novamente.  | 

# Criação de um caderno com um repositório Git associado no EMR Studio
<a name="emr-git-repo-create-notebook"></a>

**nota**  
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão **Criar Workspace** no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte [Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) e [console do Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

**Criar um caderno e associá-lo a repositórios do Git no console antigo do Amazon EMR**

1. Siga as instruções em [Criação de um caderno no EMR Studio](emr-managed-notebooks-create.md).

1. Em **Security group (Grupo de segurança)**, selecione **Use your own security group (Usar seu próprio grupo de segurança)**.
**nota**  
Os grupos de segurança do bloco de anotações devem incluir uma regra de saída que permita ao bloco de anotações rotear tráfego para a Internet por meio do cluster. Recomendamos que você crie seus próprios grupos de segurança. Para obter mais informações, consulte [Specifying EC2 security groups for EMR Notebooks](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-security-groups.html).

1. Em **Git repositories (Repositórios do Git)**, selecione **Choose repository (Escolher repositório)** para escolher qual repositório associar ao bloco de anotações.

   1. Escolha um repositório armazenado como um recurso na sua conta e selecione **Save (Salvar)**.

   1. Para adicionar um novo repositório como um recurso em sua conta, selecione **add a new repository (adicionar um novo repositório)**. Conclua o fluxo de trabalho **Add repository (Adicionar repositório)** em uma nova janela. 

# Uso de repositórios Git em um caderno do EMR Studio
<a name="emr-git-repo-open"></a>

**nota**  
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão **Criar Workspace** no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte [Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) e [console do Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

Você pode escolher **Abrir no** Jupyter JupyterLab ou **Abrir no Jupyter** ao abrir um caderno. 

Se você optar por abrir o bloco de anotações no Jupyter, será exibida uma lista de pastas e arquivos expansíveis dentro do bloco de anotações. É possível executar comandos do Git manualmente, como os apresentados a seguir em uma célula do bloco de anotações. 

```
!git pull origin primary
```

Para abrir qualquer um dos outros repositórios, navegue até as outras pastas. 

Se você optar por abrir o notebook com uma JupyterLab interface, poderá usar a extensão JupyterLab Git pré-instalada. Para obter informações sobre a extensão, consulte [jupyterlab-git](https://github.com/jupyterlab/jupyterlab-git).