Estabelecimento de acesso e de permissões para repositórios baseados em Git
O EMR Studio oferece suporte aos seguintes serviços baseados em Git:
Para permitir que os usuários do EMR Studio associem um repositório Git a um Workspace, configure os requisitos de acesso e as permissões apresentados a seguir. Você também pode configurar repositórios baseados em Git hospedados em uma rede privada ao seguir as instruções em Configuração de um repositório Git hospedado de forma privada para o EMR Studio.
- Cluster com acesso à Internet
-
Os clusters do Amazon EMR em execução no Amazon EC2 e os clusters do Amazon EMR no EKS anexados aos Workspaces do Studio devem estar em uma sub-rede privada que usa um gateway de conversão de endereços de rede (NAT) ou devem ser capazes de acessar a Internet usando um gateway privado virtual. Para obter mais informações, consulte Opções da Amazon VPC ao iniciar um cluster.
Os grupos de segurança usados com o EMR Studio também devem incluir uma regra de saída que permita que os Workspaces roteiem o tráfego para a Internet usando um cluster do EMR anexado. Para obter mais informações, consulte Definição de grupos de segurança para controlar o tráfego de rede do EMR Studio.
Importante
Se a interface de rede estiver em uma sub-rede pública, não será possível ter uma comunicação com a Internet através de um gateway da Internet (IGW).
- Permissões para AWS Secrets Manager
-
Para permitir que os usuários do EMR Studio acessem repositórios Git com segredos armazenados no AWS Secrets Manager, adicione uma política de permissões ao perfil de serviço do EMR Studio que permite a operação
secretsmanager:GetSecretValue.
Para obter informações sobre como vincular repositórios baseados em Git a Workspaces, consulte Vinculação de repositórios baseados em Git a um Workspace do EMR Studio.
Configuração de um repositório Git hospedado de forma privada para o EMR Studio
Use as instruções a seguir para configurar repositórios hospedados de forma privada para o Amazon EMR Studio. Forneça um arquivo de configuração com informações sobre os servidores DNS e Git. O EMR Studio usa essas informações para configurar Workspaces que podem rotear o tráfego para os repositórios com hospedagem própria.
nota
Se você configurar o DnsServerIpV4, o EMR Studio usa seu servidor DNS para resolver endpoints da AWS e do GitServerDnsName, mas é altamente recomendável evitar resolver os endpoints da AWS com seu DnsServerIpV4, pois isso pode interromper as funcionalidades essenciais do serviço.
Pré-requisitos
Antes de configurar um repositório Git hospedado de forma privada para o EMR Studio, você precisa de um local de armazenamento do Amazon S3 no qual o EMR Studio possa fazer backup dos Workspaces e dos arquivos de cadernos no Studio. Use o mesmo bucket do S3 especificado ao criar um Studio.
Configurar um ou mais repositórios Git hospedados de forma privada para o EMR Studio
-
Crie um arquivo de configuração usando o modelo apresentado a seguir. Inclua os seguintes valores para cada servidor Git que deseja especificar em sua configuração:
-
DnsServerIpV4- o endereço IPv4 do seu servidor DNS. Se você fornecer valores paraDnsServerIpV4eGitServerIpV4List, o valor paraDnsServerIpV4terá precedência e o EMR Studio usaráDnsServerIpV4para resolver seuGitServerDnsName.nota
Para usar repositórios Git hospedados de forma privada, seu servidor DNS deve permitir o acesso de entrada do EMR Studio. Recomendamos proteger o servidor DNS contra outros acessos não autorizados.
-
GitServerDnsName- o nome DNS do seu servidor Git. Por exemplo, ."git.example.com". -
GitServerIpV4List- uma lista de endereços IPv4 que pertencem aos seus servidores Git.
[ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ] -
-
Salve seu arquivo de configuração como
configuration.json. -
Faça o upload do arquivo de configuração no local de armazenamento padrão do Amazon S3 em uma pasta chamada
life-cycle-configuration. Por exemplo, se o local padrão do S3 fors3://, seu arquivo de configuração estará emamzn-s3-demo-bucket/workspaces3://.amzn-s3-demo-bucket/workspace/life-cycle-configuration/configuration.jsonImportante
Recomendamos que você restrinja o acesso à sua pasta
life-cycle-configurationpara os administradores do Studio e para o perfil de serviço do EMR Studio, e que proteja o arquivoconfiguration.jsoncontra acessos não autorizados. Para obter instruções, consulte Controlar o acesso a um bucket com políticas de usuário ou Práticas recomendadas de segurança para o Amazon S3.Para obter instruções sobre como fazer o upload, consulte Criar uma pasta e Fazer upload de objetos no Guia do usuário do Amazon Simple Storage Service. Para aplicar sua configuração a um Workspace, feche e reinicie o Workspace após fazer o upload do arquivo de configuração para o Amazon S3.