

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Asociación de repositorios basados en Git con Cuadernos de EMR
<a name="emr-git-repo"></a>

Puede asociar repositorios basados en Git con sus cuadernos de Amazon EMR para guardar los cuadernos en un entorno con control de versiones. Puede asociar hasta tres repositorios a un bloc de notas. Se admiten los siguientes servicios basados en Git:
+ [AWS CodeCommit](https://aws.amazon.com/codecommit)
+ [GitHub](https://www.github.com)
+ [Bitbucket](https://bitbucket.org/)
+ [GitLab](https://about.gitlab.com/)

**nota**  
Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la consola. El botón **Crear espacio de trabajo** de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte [Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) y [Consola Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

La asociación de repositorios basados en Git con su bloc de notas tiene las siguientes ventajas.
+ **Control de versiones**: puede registrar los cambios de código en un sistema de control de versiones para que pueda revisar el historial de sus cambios y revertir selectivamente algunos de ellos.
+ **Colaboración**: los compañeros que trabajan en diferentes cuadernos pueden compartir código a través de repositorios remotos basados en Git. Puede clonar o combinar código de repositorios remotos e insertar los cambios en esos repositorios remotos.
+ **Reutilización de código**: muchos cuadernos de Jupyter que muestran técnicas de análisis de datos o aprendizaje automático están disponibles en repositorios alojados públicamente, como. GitHub Puede asociar sus blocs de notas a un repositorio para reutilizar los blocs de notas de Jupyter incluidos en un repositorio.

Para usar repositorios basados en Git con Cuadernos de EMR, agregue los repositorios como recursos en la consola de Amazon EMR, asocie credenciales a los repositorios que requieran autenticación y vincule los repositorios con sus cuadernos. Puede ver una lista de repositorios que se almacenan en su cuenta y obtener más información sobre cada repositorio en la consola de Amazon EMR. Puede asociar un repositorio basado en Git existente con un bloc de notas al crearlo. 

**Topics**
+ [Requisitos previos y consideraciones al integrar un cuaderno EMR con un repositorio](emr-managed-notebooks-git-considerations.md)
+ [Agregar un repositorio basado en Git a Amazon EMR](emr-git-repo-add.md)
+ [Actualizar o eliminar un repositorio basado en Git de un espacio de trabajo de EMR Studio](emr-git-repo-delete.md)
+ [Vincular o desvincular un repositorio basado en Git en EMR Studio](emr-git-repo-link.md)
+ [Crear un nuevo cuaderno con un repositorio de Git asociado en EMR Studio](emr-git-repo-create-notebook.md)
+ [Uso de repositorios de Git en un Cuaderno de EMR Studio](emr-git-repo-open.md)

# Requisitos previos y consideraciones al integrar un cuaderno EMR con un repositorio
<a name="emr-managed-notebooks-git-considerations"></a>

Tenga en cuenta las siguientes buenas prácticas con respecto a las confirmaciones, permisos y hosting al planear la integración de un repositorio basado en Git con Cuadernos de EMR.

**nota**  
Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la nueva consola. El botón **Crear espacio de trabajo** de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte [Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) y [Consola Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

## AWS CodeCommit
<a name="code-commit-considerations"></a>

Si utilizas un CodeCommit repositorio, debes usar las credenciales de Git y HTTPS con CodeCommit. No se admiten las claves SSH ni HTTPS con el asistente de AWS CLI credenciales. CodeCommit no admite los tokens de acceso personal (). PATs *Para obtener más información, consulte [Uso de IAM con CodeCommit: credenciales de Git, claves SSH y claves de AWS acceso](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_credentials_ssh-keys.html) en la *Guía del usuario de IAM* y [Configuración para usuarios de HTTPS que usan credenciales de Git](https://docs.aws.amazon.com/codecommit/latest/userguide/setting-up-gc.html) en la Guía del AWS CodeCommit usuario.*

## Consideraciones de acceso y permisos
<a name="access-considerations"></a>

Antes de asociar un repositorio a su cuaderno, debe asegurarse de que el clúster, el rol de IAM de Cuadernos de EMR y los grupos de seguridad tengan la configuración y los permisos correctos. También puede configurar los repositorios basados en Git que aloje en una red privada siguiendo las instrucciones que se indican en [Configurar un repositorio Git alojado de forma privada para Cuadernos de EMR](#emr-managed-notebooks-private-git-repo).
+ **Acceso a Internet del clúster**: la interfaz de red que se inicia solo tiene una dirección IP privada. Esto significa que el clúster al que se conecta el bloc de notas debe estar en una subred privada con una gateway de traducción de direcciones de red (NAT) o debe poder obtener acceso a Internet a través de una gateway privada virtual. Para obtener más información, consulte [Opciones de Amazon VPC](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-clusters-in-a-vpc.html).

  Los grupos de seguridad del bloc de notas deben incluir una regla de salida que permita que el bloc de notas envíe tráfico a Internet desde el clúster. Le recomendamos que cree sus propios grupos de seguridad. Para obtener más información, consulte [Especificación de grupos de seguridad de EC2 para Cuadernos de EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-security-groups.html).
**importante**  
Si la interfaz de red se inicia en una subred pública, no podrá comunicarse con Internet a través de una puerta de enlace de Internet (IGW).
+ **Permisos para AWS Secrets Manager**: si utilizas Secrets Manager para almacenar los secretos que utilizas para acceder a un repositorio, [Rol de servicio para Cuadernos de Amazon EMR](emr-managed-notebooks-service-role.md) debe tener una política de permisos adjunta que permita la `secretsmanager:GetSecretValue` acción.

## Configurar un repositorio Git alojado de forma privada para Cuadernos de EMR
<a name="emr-managed-notebooks-private-git-repo"></a>

Utilice las siguientes instrucciones para configurar los repositorios alojados de forma privada para Cuadernos de EMR. Debe proporcionar un archivo de configuración con información sobre sus servidores de DNS y Git. Amazon EMR utiliza esta información para configurar cuadernos de EMR que puedan dirigir el tráfico a sus repositorios alojados de forma privada.

**Requisitos previos**

Para obtener acceso a un repositorio de Git alojado de forma privada para Cuadernos de EMR, debe tener lo siguiente:
+ Una Amazon S3 Control ubicación en la que se guardarán los archivos de su bloc de notas EMR.

**Para configurar uno o más repositorios de Git alojados de forma privada para Cuadernos de EMR**

1. Cree un archivo de configuración con la plantilla proporcionada. Incluya los siguientes valores para cada servidor de Git que desee especificar en la configuración:
   + **`DnsServerIpV4`**- La IPv4 dirección de su servidor DNS. Si proporciona valores para `DnsServerIpV4` y `GitServerIpV4List`, el valor de `DnsServerIpV4` tiene prioridad y se utilizará para resolver el `GitServerDnsName`.
**nota**  
Para usar repositorios de Git alojados de forma privada, su servidor de DNS debe permitir el acceso entrante desde Cuadernos de EMR. Le recomendamos que proteja su servidor de DNS contra otros accesos no autorizados.
   + **`GitServerDnsName`**: el nombre de DNS del servidor de Git. Por ejemplo, `"git.example.com"`.
   + **`GitServerIpV4List`**- Una lista de IPv4 direcciones que pertenecen a tus servidores Git.

   ```
   [
       {
           "Type": "PrivatelyHostedGitConfig",
           "Value": [
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<enterprise.git.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               },
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<git.example.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               }
           ]
       }
   ]
   ```

1. Guarde su archivo de configuración como `configuration.json`.

1. Cargue el archivo de configuración en la ubicación de almacenamiento designada de Amazon S3, en una carpeta llamada `life-cycle-configuration`. Por ejemplo, si su ubicación de S3 predeterminada es `s3://amzn-s3-demo-bucket/notebooks`, el archivo de configuración debe estar ubicado en `s3://amzn-s3-demo-bucket/notebooks/life-cycle-configuration/configuration.json`.
**importante**  
Le recomendamos que restrinja el acceso a su carpeta `life-cycle-configuration` únicamente a los administradores de Cuadernos de EMR y al rol de servicio de Cuadernos de EMR. También debe protegerse contra el acceso no autorizado de `configuration.json`. Para obtener instrucciones, consulte [Controlar el acceso a un bucket con políticas de usuario](https://docs.aws.amazon.com/AmazonS3/latest/userguide/walkthrough1.html) o [Prácticas recomendadas de seguridad para Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/security-best-practices.html).

   Para ver las instrucciones de carga, consulte [Creación de una carpeta](https://docs.aws.amazon.com/AmazonS3/latest/userguide/using-folders.html#create-folder) y [Carga de objetos](https://docs.aws.amazon.com/AmazonS3/latest/userguide/upload-objects.html) en la *Guía del usuario de Amazon Simple Storage Service*.

# Agregar un repositorio basado en Git a Amazon EMR
<a name="emr-git-repo-add"></a>

Consulte las siguientes secciones para obtener información sobre cómo agregar un repositorio basado en Git a un cuaderno de EMR de la consola antigua o a un Espacio de trabajo de EMR Studio de la consola.

**nota**  
Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la nueva consola. El botón **Crear espacio de trabajo** de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte [Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) y [Consola Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

------
#### [ Console ]

Como Cuadernos de EMR es Espacios de trabajo de EMR Studio en la nueva consola, puede seguir las instrucciones de [Vincular repositorios basados en Git a un espacio de trabajo de EMR Studio](emr-studio-git-repo.md) para asociar hasta tres repositorios de Git a su espacio de trabajo.

También puede utilizar la extensión JupyterLab Git. Seleccione el icono de **Git** en la barra lateral izquierda de su cuaderno de JupyterLab para acceder a la extensión. Para obtener información sobre la extensión, consulta el repositorio [ GitHub jupyterlab-git](https://github.com/jupyterlab/jupyterlab-git).

Para asociar un repositorio de Git a un espacio de trabajo, el administrador de Studio debe tomar medidas para configurar Studio y permitir la vinculación de repositorios de Git. Para obtener más información, consulte [Establecer el acceso y los permisos para los repositorios basados en Git](emr-studio-enable-git.md).

------

# Actualizar o eliminar un repositorio basado en Git de un espacio de trabajo de EMR Studio
<a name="emr-git-repo-delete"></a>

Consulte las siguientes secciones para obtener información sobre cómo eliminar un repositorio basado en Git de un cuaderno de EMR de la consola antigua o de un Espacio de trabajo de EMR Studio de la consola.

**nota**  
Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la nueva consola. El botón **Crear espacio de trabajo** de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte [Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) y [Consola Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

------
#### [ Console ]

Como Cuadernos de EMR es Espacios de trabajo de EMR Studio en la nueva consola, puede consultar [Vincular repositorios basados en Git a un espacio de trabajo de EMR Studio](emr-studio-git-repo.md) para obtener más información sobre cómo trabajar con los repositorios de Git en su espacio de trabajo. Sin embargo, en este momento, no puede eliminar los repositorios de Git de los espacios de trabajo.

------

# Vincular o desvincular un repositorio basado en Git en EMR Studio
<a name="emr-git-repo-link"></a>

Siga estos pasos para vincular o desvincular un repositorio basado en Git a un cuaderno de EMR de la consola anterior o a un Espacio de trabajo de EMR Studio de la consola.

**nota**  
Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la consola. El botón **Crear espacio de trabajo** de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte [Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) y [Consola Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

------
#### [ Console ]

Como Cuadernos de EMR es Espacios de trabajo de EMR Studio en la nueva consola, puede consultar [Vincular repositorios basados en Git a un espacio de trabajo de EMR Studio](emr-studio-git-repo.md) para obtener más información sobre cómo trabajar con los repositorios de Git en su espacio de trabajo. Sin embargo, en este momento, no puede eliminar los repositorios de Git de los espacios de trabajo.

------

## Descripción del estado del repositorio
<a name="emr-managed-notebooks-repository-status"></a>

Un repositorio Git puede tener cualquiera de los siguientes estados en la lista de repositorios. Para obtener más información sobre cómo vincular EMR Notebooks con los repositorios Git, consulte [Vincular o desvincular un repositorio basado en Git en EMR Studio](#emr-git-repo-link).


| Status | Significado | 
| --- | --- | 
|  Vinculación  |  El repositorio de Git se está vinculando al bloc de notas. Mientras el repositorio tiene el estado **Linking (En proceso de vinculación)**, no se puede detener el bloc de notas.  | 
|  Linked (Vinculado)  |  El repositorio de Git está vinculado al bloc de notas. Mientras el repositorio tenga el estado **Linked (Vinculado)**, estará conectado al repositorio remoto.  | 
|  Link Failed (Error al vincular)  |  El repositorio de Git no pudo vincularse al bloc de notas. Puede intentar vincularlo de nuevo.  | 
|  Unlinking (En proceso de desvinculación)  |  El repositorio de Git se está desvinculando del bloc de notas. Mientras el repositorio tenga el estado **Unlinking (En proceso de desvinculación)**, no podrá detener el bloc de notas. Cuando se desvincula un repositorio de Git de un bloc de notas solo se desconecta del repositorio remoto: no se elimina ningún código del bloc de notas.  | 
|  Unlink Failed (Error al desvincular)  |  El repositorio de Git no se pudo desvincular del bloc de notas. Puede intentar desvincularlo de nuevo.  | 

# Crear un nuevo cuaderno con un repositorio de Git asociado en EMR Studio
<a name="emr-git-repo-create-notebook"></a>

**nota**  
Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la consola. El botón **Crear espacio de trabajo** de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte [Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) y [Consola Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

**Para crear un cuaderno y asociarlo con repositorios de Git en la consola de Amazon EMR antigua**

1. Siga las instrucciones de [Crear un cuaderno en EMR Studio](emr-managed-notebooks-create.md).

1. En **Security group (Grupo de seguridad)**, elija **Use your own security group (Usar su propio grupo de seguridad)**.
**nota**  
Los grupos de seguridad del bloc de notas deben incluir una regla de salida para permitir que el bloc de notas envíe tráfico a Internet a través del clúster. Le recomendamos que cree sus propios grupos de seguridad. Para obtener más información, consulte [Especificación de grupos de seguridad de EC2 para Cuadernos de EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-security-groups.html).

1. En **Git repositories (Repositorios de Git)**, **elija el repositorio** que desee asociar al bloc de notas.

   1. Elija un repositorio almacenado como recurso en su cuenta y, a continuación, elija **Save (Guardar)**.

   1. Para añadir un nuevo repositorio como recurso a su cuenta, elija **add a new repository (añadir un nuevo repositorio)**. Complete el flujo de trabajo **Add repository (Añadir repositorio)** en una ventana nueva. 

# Uso de repositorios de Git en un Cuaderno de EMR Studio
<a name="emr-git-repo-open"></a>

**nota**  
Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la consola. El botón **Crear espacio de trabajo** de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte [Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-notebooks-migration.html) y [Consola Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html).

Al abrir un bloc de notas, puedes elegir entre **Abrir en JupyterLab** Jupyter o **Abrir en Jupyter**. 

Si elige abrir el bloc de notas en Jupyter, se muestra una lista expandible de archivos y carpetas dentro del bloc de notas. Puede ejecutar manualmente comandos de Git como los siguientes en una celda del bloc de notas. 

```
!git pull origin primary
```

Para abrir cualquiera de los repositorios adicionales, desplácese hasta otras carpetas. 

Si elige abrir el cuaderno con una JupyterLab interfaz, puede usar la extensión JupyterLab Git preinstalada. Para obtener más información acerca de la extensión, consulte [jupyterlab-git](https://github.com/jupyterlab/jupyterlab-git).