Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Definizione di accesso e autorizzazioni per i repository basati su Git
EMR Studio supporta i seguenti servizi basati su Git:
Per consentire agli utenti di EMR Studio di associare un repository Git a un Workspace, imposta i seguenti requisiti di accesso e autorizzazione. È inoltre possibile configurare i repository basati su Git ospitati in una rete privata seguendo le istruzioni riportate in Configurazione di un repository Git ospitato privatamente per EMR Studio.
- Accesso a Internet del cluster
-
Sia i cluster Amazon EMR in esecuzione su Amazon che i cluster EC2 Amazon EMR su EKS collegati a Studio Workspaces devono trovarsi in una sottorete privata che utilizza un gateway NAT (Network Address Translation) oppure devono essere in grado di accedere a Internet tramite un gateway privato virtuale. Per ulteriori informazioni, consulta Opzioni Amazon VPC all'avvio di un cluster.
I gruppi di sicurezza utilizzati con EMR Studio devono includere anche una regola in uscita che consenta ai Workspace di instradare il traffico a Internet da un cluster EMR collegato. Per ulteriori informazioni, consulta Definizione di gruppi di sicurezza per controllare il traffico di rete EMR Studio.
Importante
Se l'interfaccia di rete si trova in una sottorete pubblica, non sarà in grado di comunicare con Internet tramite un Gateway Internet (IGW).
- Autorizzazioni per Gestione dei segreti AWS
-
Per consentire agli utenti di EMR Studio di accedere ai repository Git con segreti archiviati in Gestione dei segreti AWS, aggiungi una policy di autorizzazione al ruolo di servizio per EMR Studio che consente l'operazione
secretsmanager:GetSecretValue.
Per ulteriori informazioni su come collegare repository basati su Git ai Workspace, consulta Collegamento di repository basati su Git a un WorkSpace EMR Studio.
Configurazione di un repository Git ospitato privatamente per EMR Studio
Utilizza le seguenti istruzioni per configurare repository ospitati privatamente per Amazon EMR Studio. Fornire un file di configurazione con informazioni sui server DNS e Git. EMR Studio utilizza queste informazioni per configurare Workspace in grado di instradare il traffico ai repository autogestiti.
Nota
Se configuriDnsServerIpV4, EMR Studio utilizza il tuo server DNS per risolvere sia i tuoi endpoint che quelli di GitServerDnsName AWS, ma si consiglia vivamente di evitare di risolvere AWS Endpoints con te in DnsServerIpV4 quanto ciò potrebbe interrompere le funzionalità essenziali del servizio.
Prerequisiti
Prima di configurare un repository Git ospitato in livello privato per EMR Studio, è necessario un archivio Amazon S3 in cui EMR Studio possa eseguire il backup di Workspace e file notebook nello Studio. Utilizza lo stesso bucket S3 specificato durante la creazione di uno Studio.
Configurazione di uno o più repository Git ospitati privatamente per EMR Studio
-
Crea un file di configurazione utilizzando il seguente modello. Includi i seguenti valori per ogni server Git che desideri specificare nella configurazione:
-
DnsServerIpV4- L'indirizzo del tuo server DNS. IPv4 Se si forniscono valori perDnsServerIpV4eGitServerIpV4List, il valore perDnsServerIpV4ha la precedenza e EMR Studio utilizzaDnsServerIpV4per risolvere ilGitServerDnsName.Nota
Per utilizzare repository Git ospitati privatamente, il server DNS deve consentire l'accesso in ingresso da EMR Studio. Si consiglia di proteggere il server DNS da altri accessi non autorizzati.
-
GitServerDnsName: il nome DNS del server Git. Ad esempio,"git.example.com". -
GitServerIpV4List- Un elenco di IPv4 indirizzi che appartengono ai tuoi server Git.
[ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ] -
-
Salva il file di configurazione come
configuration.json. -
Carica il file di configurazione nella posizione di storage predefinita di Amazon S3 in una cartella chiamata.
life-cycle-configurationAd esempio, se la posizione S3 predefinita ès3://, il file di configurazione sarà inamzn-s3-demo-bucket/workspaces3://.amzn-s3-demo-bucket/workspace/life-cycle-configuration/configuration.jsonImportante
Si consiglia di limitare l'accesso alla tua cartella
life-cycle-configurationagli amministratori dello Studio e al ruolo di servizio EMR Studio, nonché di proteggereconfiguration.jsoncontro l'accesso non autorizzato. Per ricevere istruzioni, consulta Controllo dell'accesso a un bucket con policy utente o Best practice di sicurezza per Amazon S3.Per istruzioni sul caricamento, consulta Creazione di una cartella e Caricamento degli oggetti nella Guida per l'utente di Amazon Simple Storage. Per applicare la configurazione a un Workspace esistente, chiudi e riavvia il Workspace dopo aver caricato il file di configurazione su Amazon S3.