

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Establecer el acceso y los permisos para los repositorios basados en Git
<a name="emr-studio-enable-git"></a>

EMR Studio admite los siguientes servicios basados en Git:
+ [AWS CodeCommit](https://aws.amazon.com/codecommit)
+ [GitHub](https://github.com)
+ [Bitbucket](https://bitbucket.org/)
+ [GitLab](https://about.gitlab.com/)

Para permitir que los usuarios de EMR Studio asocien un repositorio de Git a un espacio de trabajo, configure los siguientes requisitos de acceso y permisos. También puede configurar los repositorios basados en Git que aloje en una red privada siguiendo las instrucciones que se indican en [Configurar un repositorio de Git alojado de forma privada para EMR Studio](#emr-studio-private-git-repo).

**Acceso a internet en clúster**  
Tanto los clústeres de Amazon EMR que se ejecutan en Amazon EC2 como los de Amazon EMR en EKS asociados a espacios de trabajo de Studio deben estar en una subred privada que utilice una puerta de enlace de traducción de direcciones de red (NAT) o deben poder acceder a internet a través de una puerta de enlace privada virtual. Para obtener más información, consulte [Opciones de Amazon VPC al lanzar un clúster](emr-clusters-in-a-vpc.md).  
Los grupos de seguridad que utilice con EMR Studio también deben incluir una regla de salida que permita que los espacios de trabajo enruten el tráfico a internet desde un clúster de EMR asociado. Para obtener más información, consulte [Definir grupos de seguridad para controlar el tráfico de red de EMR Studio](emr-studio-security-groups.md).  
Si la interfaz de red se encuentra en una subred pública, no podrá comunicarse con internet a través de una puerta de enlace de Internet (IGW).

**Permisos para AWS Secrets Manager**  
Para permitir que los usuarios de EMR Studio accedan a los repositorios de Git con secretos almacenados en AWS Secrets Manager, agregue una política de permisos al [rol de servicio de EMR Studio](emr-studio-service-role.md) que permite la operación `secretsmanager:GetSecretValue`.

Para obtener información sobre cómo vincular los repositorios basados en Git a los espacios de trabajo, consulte [Vincular repositorios basados en Git a un espacio de trabajo de EMR Studio](emr-studio-git-repo.md).

## Configurar un repositorio de Git alojado de forma privada para EMR Studio
<a name="emr-studio-private-git-repo"></a>

Siga las instrucciones siguientes para configurar los repositorios alojados de forma privada para Amazon EMR Studio. Proporcione un archivo de configuración con información sobre sus servidores DNS y Git. EMR Studio utiliza esta información para configurar los espacios de trabajo que pueden enrutar el tráfico a sus repositorios autoadministrados.

**nota**  
Si configura `DnsServerIpV4`, EMR Studio utilizará su servidor DNS para resolver sus `GitServerDnsName` y los puntos de conexión de <shared id="AWS"/>, pero se recomienda encarecidamente evitar resolver los puntos de conexión de <shared id="AWS"/> con su `DnsServerIpV4`, ya que esto puede interrumpir las funcionalidades esenciales del servicio.

**Requisitos previos**

Antes de configurar un repositorio de Git alojado de forma privada para EMR Studio, necesita una ubicación de almacenamiento de Amazon S3 en la que EMR Studio pueda realizar copias de seguridad de los espacios de trabajo y los archivos de cuadernos del estudio. Utilice el mismo bucket de S3 que especifique al crear un estudio.

**Para configurar un repositorio de Git alojado de forma privada para EMR Studio**

1. Cree un archivo de configuración mediante la siguiente plantilla. Incluya los siguientes valores para cada servidor de Git que desee especificar en la configuración:
   + **`DnsServerIpV4`**- La IPv4 dirección de su servidor DNS. Si proporciona valores para `DnsServerIpV4` y `GitServerIpV4List`, el valor de `DnsServerIpV4` tiene prioridad y EMR Studio utiliza `DnsServerIpV4` para resolver el `GitServerDnsName`.
**nota**  
Para usar repositorios de Git alojados de forma privada, su servidor DNS debe permitir el acceso entrante desde EMR Studio. Le instamos a que proteja su servidor DNS contra otros accesos no autorizados.
   + **`GitServerDnsName`**: el nombre de DNS del servidor de Git. Por ejemplo, `"git.example.com"`.
   + **`GitServerIpV4List`**- Una lista de IPv4 direcciones que pertenecen a tus servidores Git.

   ```
   [
       {
           "Type": "PrivatelyHostedGitConfig",
           "Value": [
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<enterprise.git.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               },
               {
                   "DnsServerIpV4": "<10.24.34.xxx>",
                   "GitServerDnsName": "<git.example.com>",
                   "GitServerIpV4List": [
                       "<xxx.xxx.xxx.xxx>",
                       "<xxx.xxx.xxx.xxx>"
                   ]
               }
           ]
       }
   ]
   ```

1. Guarde su archivo de configuración como `configuration.json`.

1. Cargue el archivo de configuración en su ubicación de almacenamiento por defecto de Amazon S3, en una carpeta llamada `life-cycle-configuration`. Por ejemplo, si su ubicación de S3 predeterminada es `s3://amzn-s3-demo-bucket/workspace`, el archivo de configuración estaría en `s3://amzn-s3-demo-bucket/workspace/life-cycle-configuration/configuration.json`.
**importante**  
Le instamos a que restrinja el acceso a su carpeta `life-cycle-configuration` a los administradores de Studio y a su rol de servicio de EMR Studio, y a que proteja `configuration.json` contra el acceso no autorizado. Para obtener instrucciones, consulte [Controlar el acceso a un bucket con políticas de usuario](https://docs.aws.amazon.com/AmazonS3/latest/userguide/walkthrough1.html) o [Prácticas recomendadas de seguridad para Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/security-best-practices.html).

   Para ver las instrucciones de carga, consulte [Creación de una carpeta](https://docs.aws.amazon.com/AmazonS3/latest/userguide/using-folders.html#create-folder) y [Carga de objetos](https://docs.aws.amazon.com/AmazonS3/latest/userguide/upload-objects.html) en la *Guía del usuario de Amazon Simple Storage Service*. Para aplicar la configuración a un espacio de trabajo existente, ciérrelo y reinícielo después de cargar el archivo de configuración en Amazon S3.