Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Conditions préalables et considérations lors de l'intégration d'un bloc-notes EMR à un référentiel
Tenez compte des meilleures pratiques suivantes concernant les validations, les autorisations et l'hébergement lorsque vous planifiez d'intégrer un référentiel Git à EMR Notebooks.
Note
Les notebooks EMR sont disponibles sous forme d'espaces de travail EMR Studio dans la console. Le bouton Créer un espace de travail de la console vous permet de créer de nouveaux blocs-notes. Pour accéder aux Workspaces ou en créer, les utilisateurs EMR Notebooks doivent disposer d'autorisations de rôle IAM supplémentaires. Pour plus d'informations, consultez Amazon EMR Notebooks are Amazon EMR Studio Workspaces dans la console et Amazon EMR.
AWS CodeCommit
Si vous utilisez un CodeCommit dépôt, vous devez utiliser les informations d'identification Git et HTTPS avec CodeCommit. Les clés SSH et le protocole HTTPS avec l'assistant AWS CLI d'identification ne sont pas pris en charge. CodeCommit ne prend pas en charge les jetons d'accès personnels (PATs). Pour plus d'informations, voir Utilisation d'IAM avec CodeCommit : informations d'identification Git, clés SSH et clés d' AWS accès dans le guide de l'utilisateur IAM et Configuration pour les utilisateurs HTTPS à l'aide des informations d'identification Git dans le guide de l'AWS CodeCommit utilisateur.
Considérations relatives à l'accès et aux autorisations
Avant d'associer un référentiel à votre bloc-notes, vous devez vous assurer que votre cluster, votre rôle IAM pour les blocs-notes EMR et vos groupes de sécurité disposent des paramètres et autorisations appropriés. Vous pouvez également configurer des référentiels Git que vous hébergez sur un réseau privé en suivant les instructions de Configuration d'un référentiel Git hébergé sur un serveur privé pour les blocs-notes EMR.
-
Accès à internet du cluster – L'interface réseau lancée n'a qu'une adresse IP privée. Cela signifie que le cluster auquel votre bloc-notes se connecte doit se trouver dans un sous-réseau privé doté d'une passerelle NAT (Network Address Translation) ou doit pouvoir accéder à Internet via une passerelle privée virtuelle. Pour plus d'informations, consultez la rubrique Options Amazon VPC.
Les groupes de sécurité de votre bloc-notes doivent inclure une règle sortante pour permettre au bloc-notes d'acheminer le trafic vers Internet depuis le cluster. Il est recommandé de créer vos propres groupes de sécurité. Pour plus d'informations, consultez la section Spécification des groupes EC2 de sécurité pour les Notebooks EMR.
Important
Si l'interface réseau est lancée dans un sous-réseau public, elle ne pourra pas communiquer avec l'internet par l'intermédiaire d'une passerelle internet (IGW).
-
Autorisations pour AWS Secrets Manager : si vous utilisez Secrets Manager pour stocker les secrets que vous utilisez pour accéder à un référentiel, une politique d'autorisation Rôle de service pour Blocs-notes EMR doit être jointe pour autoriser cette
secretsmanager:GetSecretValue
action.
Configuration d'un référentiel Git hébergé sur un serveur privé pour les blocs-notes EMR
Suivez les instructions ci-dessous pour configurer des référentiels hébergés sur un serveur privé pour les blocs-notes EMR. Vous devez fournir un fichier de configuration contenant des informations sur vos serveurs DNS et Git. Amazon EMR utilise ces informations pour configurer les blocs-notes EMR qui peuvent acheminer le trafic vers vos référentiels hébergés sur un serveur privé.
Prérequis
Avant de configurer un référentiel Git hébergé sur un serveur privé pour les blocs-notes EMR, vous devez disposer des éléments suivants :
-
Amazon S3 Control Emplacement où les fichiers de votre bloc-notes EMR seront enregistrés.
Configuration d'un ou de plusieurs référentiels Git hébergés sur un serveur privé pour les blocs-notes EMR
-
Créez un fichier de configuration à l'aide du modèle fourni. Incluez les valeurs suivantes pour chaque serveur Git que vous souhaitez spécifier dans votre configuration :
-
DnsServerIpV4
- L' IPv4 adresse de votre serveur DNS. Si vous fournissez des valeurs à la fois pourDnsServerIpV4
etGitServerIpV4List
, la valeur deDnsServerIpV4
est prioritaire et sera utilisée pour résoudre votreGitServerDnsName
.Note
Pour utiliser des référentiels Git hébergés sur un serveur privé, votre serveur DNS doit autoriser l'accès entrant depuis les blocs-notes EMR. Nous vous recommandons vivement de protéger votre serveur DNS contre tout autre accès non autorisé.
-
GitServerDnsName
– Le nom DNS de votre serveur Git. Par exemple"git.example.com"
. -
GitServerIpV4List
- Une liste d' IPv4adresses appartenant à votre/vos serveur (s) Git.
[ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "
<10.24.34.xxx>
", "GitServerDnsName": "<enterprise.git.com>
", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>
", "<xxx.xxx.xxx.xxx>
" ] }, { "DnsServerIpV4": "<10.24.34.xxx>
", "GitServerDnsName": "<git.example.com>
", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>
", "<xxx.xxx.xxx.xxx>
" ] } ] } ] -
-
Enregistrez votre fichier de configuration sous
configuration.json
. -
Chargez le fichier de configuration dans l'emplacement de stockage Amazon S3 que vous avez désigné dans un dossier appelé
life-cycle-configuration
. Par exemple, si votre emplacement S3 par défaut ests3://amzn-s3-demo-bucket/notebooks
, votre fichier de configuration doit se trouver à l'adresses3://amzn-s3-demo-bucket/notebooks/life-cycle-configuration/configuration.json
.Important
Nous vous recommandons vivement de limiter l'accès à votre dossier
life-cycle-configuration
aux seuls administrateurs des blocs-notes EMR et à la fonction du service associée aux blocs-notes EMR. Vous devez également protégerconfiguration.json
contre tout accès non autorisé. Pour des instructions, consultez la rubrique Contrôle de l'accès à un compartiment avec des politiques utilisateur ou Bonnes pratiques de sécurité pour Amazon S3.Pour des instructions sur le chargement, consultez les rubriques Création d'un dossier et Chargement d'objets dans le Guide de l'utilisateur d'Amazon Simple Storage Service.