Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création d'un environnement Amazon MWAA
Amazon Managed Workflows pour Apache Airflow configure Apache Airflow dans un environnement de la version que vous avez choisie en utilisant le même Apache Airflow open source et la même interface utilisateur disponibles auprès d'Apache. Ce guide décrit les étapes de création d'un environnement Amazon MWAA.
Table des matières
Avant de commencer
-
Le réseau VPC que vous spécifiez pour votre environnement ne peut pas être modifié une fois l'environnement créé.
-
Vous avez besoin d'un compartiment Amazon S3 configuré pour bloquer tout accès public, avec activation de la gestion des versions des compartiments.
-
Vous devez disposer d'un AWS compte autorisé pour utiliser Amazon MWAA et d'un droit d'accès AWS Identity and Access Management (IAM) pour créer des rôles IAM. Si vous choisissez le mode d'accès réseau privé pour le serveur Web Apache Airflow, qui limite l'accès à Apache Airflow au sein de votre Amazon VPC, vous aurez besoin d'une autorisation dans IAM pour créer des points de terminaison Amazon VPC.
Versions d'Apache Airflow
Les versions d'Apache Airflow suivantes sont prises en charge sur Amazon Managed Workflows pour Apache Airflow.
Note
-
À partir d'Apache Airflow v2.2.2, Amazon MWAA prend en charge l'installation des exigences Python, des packages de fournisseurs et des plugins personnalisés directement sur le serveur Web Apache Airflow.
-
À partir de la version 2.7.2 d'Apache Airflow, votre fichier d'exigences doit inclure une instruction.
--constraint
Si vous ne fournissez aucune contrainte, Amazon MWAA vous en indiquera une afin de garantir que les packages répertoriés dans vos exigences sont compatibles avec la version d'Apache Airflow que vous utilisez.Pour plus d'informations sur la configuration des contraintes dans votre fichier d'exigences, consultez Installation des dépendances Python.
Version d'Apache Airflow | Guide d'Apache Airflow | Contraintes d'Apache Airflow | Version Python |
---|---|---|---|
Création d'un environnement
La section suivante décrit les étapes de création d'un environnement Amazon MWAA.
Première étape : Spécifier les détails
Pour spécifier les détails de l'environnement
-
Ouvrez la console Amazon MWAA
. -
Utilisez le sélecteur de AWS région pour sélectionner votre région.
-
Choisissez Create environment.
-
Sur la page Spécifier les détails, sous Détails de l'environnement :
-
Tapez un nom unique pour votre environnement dans Nom.
-
Choisissez la version Apache Airflow dans la version Airflow.
Note
Si aucune valeur n'est spécifiée, la dernière version d'Apache Airflow est utilisée par défaut. La dernière version disponible est Apache Airflow v2.10.3.
-
-
Sous le code DAG dans Amazon S3, spécifiez les éléments suivants :
-
Seau S3. Choisissez Browse S3 et sélectionnez votre compartiment Amazon S3, ou entrez l'URI Amazon S3.
-
DAGs folder. Choisissez Browse S3 et sélectionnez le
dags
dossier dans votre compartiment Amazon S3, ou entrez l'URI Amazon S3. -
Fichier de plugins : facultatif. Choisissez Browse S3 et sélectionnez le
plugins.zip
fichier dans votre compartiment Amazon S3, ou entrez l'URI Amazon S3. -
Fichier des exigences : facultatif. Choisissez Browse S3 et sélectionnez le
requirements.txt
fichier dans votre compartiment Amazon S3, ou entrez l'URI Amazon S3. -
Fichier de script de démarrage (facultatif), choisissez Parcourir S3et sélectionnez le fichier de script dans votre compartiment Amazon S3 ou entrez l'URI Amazon S3.
-
-
Choisissez Suivant.
Deuxième étape : configurer les paramètres avancés
Pour configurer les paramètres avancés
-
Sur la page Configurer les paramètres avancés, sous Mise en réseau :
-
Choisissez votre Amazon VPC.
Cette étape permet de remplir deux des sous-réseaux privés de votre Amazon VPC.
-
-
Sous Accès au serveur Web, sélectionnez votre mode d'accès Apache Airflow préféré :
-
Réseau privé. Cela limite l'accès à l'interface utilisateur d'Apache Airflow aux utilisateurs de votre Amazon VPC qui ont obtenu l'accès à la politique IAM de votre environnement. Pour cette étape, vous devez disposer d'une autorisation pour créer des points de terminaison Amazon VPC.
Note
Choisissez l'option Réseau privé si votre interface utilisateur Apache Airflow est uniquement accessible au sein d'un réseau d'entreprise et si vous n'avez pas besoin d'accéder aux référentiels publics pour l'installation des exigences du serveur Web. Si vous choisissez cette option de mode d'accès, vous devez créer un mécanisme pour accéder à votre serveur Web Apache Airflow dans votre Amazon VPC. Pour de plus amples informations, veuillez consulter Accès au point de terminaison VPC de votre serveur Web Apache Airflow (accès réseau privé).
-
Réseau public. Cela permet aux utilisateurs autorisés à accéder à l'interface utilisateur d'Apache Airflow via Internet à la politique IAM de votre environnement.
-
-
Sous Groupe (s) de sécurité, choisissez le groupe de sécurité utilisé pour sécuriser votre Amazon VPC :
-
Par défaut, Amazon MWAA crée un groupe de sécurité dans votre Amazon VPC avec des règles d'entrée et de sortie spécifiques dans Créer un nouveau groupe de sécurité.
-
Facultatif. Décochez la case dans Créer un nouveau groupe de sécurité pour sélectionner jusqu'à 5 groupes de sécurité.
Note
Un groupe de sécurité Amazon VPC existant doit être configuré avec des règles entrantes et sortantes spécifiques pour autoriser le trafic réseau. Pour en savoir plus, veuillez consulter la section Sécurité de votre VPC sur Amazon MWAA.
-
-
Sous Classe d'environnement, choisissez une classe d'environnement.
Nous vous recommandons de choisir la plus petite taille nécessaire pour supporter votre charge de travail. Vous pouvez modifier la classe d'environnement à tout moment.
-
Pour Nombre maximal de travailleurs, spécifiez le nombre maximal de travailleurs Apache Airflow à exécuter dans l'environnement.
Pour de plus amples informations, veuillez consulter Exemple de cas d'utilisation à hautes performances.
-
Spécifiez le nombre maximal de serveurs Web et le nombre minimal de serveurs Web pour configurer la manière dont Amazon MWAA adapte les serveurs Web Apache Airflow dans votre environnement.
Pour plus d'informations sur le dimensionnement automatique du serveur Web, consultezConfiguration du dimensionnement automatique du serveur Web Amazon MWAA.
-
Sous Chiffrement, choisissez une option de chiffrement des données :
-
Par défaut, Amazon MWAA utilise une AWS clé propre pour chiffrer vos données.
-
Facultatif. Choisissez Personnaliser les paramètres de chiffrement (avancés) pour choisir une autre AWS KMS clé. Si vous choisissez de spécifier une clé gérée par le client à cette étape, vous devez spécifier un ID de AWS KMS clé ou un ARN. AWS KMS les alias et les clés multirégionales ne sont pas pris en charge par Amazon MWAA. Si vous avez spécifié une clé Amazon S3 pour le chiffrement côté serveur sur votre compartiment Amazon S3, vous devez spécifier la même clé pour votre environnement Amazon MWAA.
Note
Vous devez être autorisé à accéder à la clé pour la sélectionner sur la console Amazon MWAA. Vous devez également autoriser Amazon MWAA à utiliser la clé en joignant la politique décrite dansJoindre une politique clé.
-
-
Recommandé Sous Surveillance, choisissez une ou plusieurs catégories de journaux pour la configuration de journalisation Airflow afin d'envoyer les journaux Apache Airflow à CloudWatch Logs :
-
Journaux des tâches Airflow. Choisissez le type de journaux de tâches Apache Airflow à envoyer au niveau CloudWatch Logs in Log.
-
Journaux du serveur Web Airflow. Choisissez le type de journaux du serveur Web Apache Airflow à envoyer au niveau CloudWatch Logs in Log.
-
Journaux du planificateur de débit d'air. Choisissez le type de journaux du planificateur Apache Airflow à envoyer au niveau CloudWatch Logs in Log.
-
Journaux des travailleurs de Airflow. Choisissez le type de journaux de travail Apache Airflow à envoyer au niveau CloudWatch Logs in Log.
-
Journaux de traitement Airflow DAG. Choisissez le type de journaux de traitement du DAG Apache Airflow à envoyer au niveau CloudWatch Logs in Log.
-
-
Facultatif. Pour les options de configuration Airflow, choisissez l'option Ajouter une configuration personnalisée.
Vous pouvez choisir parmi la liste déroulante suggérée des options de configuration d'Apache Airflow pour votre version d'Apache Airflow ou spécifier des options de configuration personnalisées. Par exemple,
core.default_task_retries
:3
. -
Facultatif. Sous Balises, choisissez Ajouter une nouvelle balise pour associer des balises à votre environnement. Par exemple,
Environment
:Staging
. -
Sous Autorisations, choisissez un rôle d'exécution :
-
Par défaut, Amazon MWAA crée un rôle d'exécution dans Create a new role. Vous devez être autorisé à créer des rôles IAM pour utiliser cette option.
-
Facultatif. Choisissez Enter role ARN pour saisir le Amazon Resource Name (ARN) d'un rôle d'exécution existant.
-
-
Choisissez Suivant.
Troisième étape : révision et création
Pour consulter un résumé de l'environnement
-
Consultez le résumé de l'environnement, puis choisissez Créer un environnement.
Note
Il faut environ vingt à trente minutes pour créer un environnement.