Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Installazione delle dipendenze in Python
Una dipendenza Python è qualsiasi pacchetto o distribuzione non incluso nell'installazione base di Apache Airflow per la tua versione di Apache Airflow nel tuo ambiente Amazon Managed Workflows for Apache Airflow. Questo argomento descrive i passaggi per installare le dipendenze Python di Apache Airflow nell'ambiente Amazon MWAA utilizzando un requirements.txt file nel bucket Amazon S3.
Indice
Prerequisiti
Avrai bisogno di quanto segue prima di completare i passaggi in questa pagina.
-
Autorizzazioni: Account AWS devi aver ottenuto l'accesso dal tuo amministratore alla politica di controllo degli MWAAFull ConsoleAccess accessi di Amazon per il tuo ambiente. Inoltre, il tuo ambiente Amazon MWAA deve essere autorizzato dal tuo ruolo di esecuzione ad accedere alle AWS risorse utilizzate dal tuo ambiente.
-
Accesso: se è necessario accedere agli archivi pubblici per installare le dipendenze direttamente sul server Web, l'ambiente deve essere configurato con l'accesso al server Web di rete pubblica. Per ulteriori informazioni, vedi Modalità di accesso ad Apache Airflow.
-
Configurazione Amazon S3 : il bucket Amazon S3 utilizzato per archiviare i plug-in
plugins.zippersonalizzati e DAGs lerequirements.txtdipendenze Python deve essere configurato con Public Access Blocked e Versioning Enabled.
Come funziona
Su Amazon MWAA, installi tutte le dipendenze Python caricando un file nel requirements.txt tuo bucket Amazon S3, quindi specificando la versione del file sulla console Amazon MWAA ogni volta che aggiorni il file. Amazon MWAA viene eseguito pip3 install -r requirements.txt per installare le dipendenze Python sullo scheduler Apache Airflow e su ciascuno dei worker.
Per eseguire le dipendenze di Python nel tuo ambiente, devi fare tre cose:
-
Crea un
requirements.txtfile localmente. -
Carica il file locale
requirements.txtnel tuo bucket Amazon S3. -
Specificare la versione di questo file nel campo File dei requisiti sulla console Amazon MWAA.
Nota
Se è la prima volta che crei e carichi un requirements.txt file nel tuo bucket Amazon S3, devi anche specificare il percorso del file sulla console Amazon MWAA. Devi completare questo passaggio solo una volta.
Panoramica delle dipendenze in Python
Puoi installare gli extra di Apache Airflow e altre dipendenze Python dalle dipendenze Python Package PyPi Index (.org), Python .whl wheels () o Python ospitate su un repository privato conforme a /PEP-503 nel tuo ambiente. PyPi
Limiti di posizione e dimensione delle dipendenze in Python
Lo scheduler Apache Airflow e gli operatori cercano i pacchetti nel requirements.txt file e i pacchetti vengono installati nell'ambiente in. /usr/local/airflow/.local/bin
-
Limite di dimensione. Consigliamo un
requirements.txtfile che faccia riferimento a librerie la cui dimensione combinata è inferiore a 1 GB. Maggiore è il numero di librerie che Amazon MWAA deve installare, maggiore è il tempo di avvio in un ambiente. Sebbene Amazon MWAA non limiti esplicitamente la dimensione delle librerie installate, se le dipendenze non possono essere installate entro dieci minuti, il servizio Fargate andrà in timeout e tenterà di ripristinare l'ambiente a uno stato stabile.
Creazione di un file requirements.txt
I passaggi seguenti descrivono i passaggi consigliati per creare un file requirements.txt localmente.
Fase uno: testare le dipendenze di Python utilizzando l'utilità CLI di Amazon MWAA
-
L'utilità CLI (Command Line Interface) replica localmente un ambiente Amazon Managed Workflows for Apache Airflow.
-
La CLI crea localmente un'immagine del contenitore Docker simile a un'immagine di produzione Amazon MWAA. Puoi utilizzarlo per eseguire un ambiente Apache Airflow locale per sviluppare e DAGs testare plugin personalizzati e dipendenze prima della distribuzione su Amazon MWAA.
-
Per eseguire la CLI, fare riferimento a aws-mwaa-docker-images
on. GitHub
Fase due: Creare il requirements.txt
La sezione seguente descrive come specificare le dipendenze Python dall'indice dei pacchetti Python in un filerequirements.txt
Caricamento requirements.txt su Amazon S3
Puoi utilizzare la console Amazon S3 o il AWS Command Line Interface (AWS CLI) per caricare un requirements.txt file nel tuo bucket Amazon S3.
Usando il AWS CLI
Il AWS Command Line Interface (AWS CLI) è uno strumento open source che è possibile utilizzare per interagire con i AWS servizi utilizzando i comandi nella shell della riga di comando. Per completare la procedura descritta in questa pagina, è necessario quanto segue:
Per caricare utilizzando il AWS CLI
-
Usa il seguente comando per elencare tutti i tuoi bucket Amazon S3.
aws s3 ls -
Usa il seguente comando per elencare i file e le cartelle nel bucket Amazon S3 per il tuo ambiente.
aws s3 ls s3://YOUR_S3_BUCKET_NAME -
Il comando seguente carica un
requirements.txtfile in un bucket Amazon S3.aws s3 cp requirements.txt s3://amzn-s3-demo-bucket/requirements.txt
Utilizzo della console Amazon S3
La console Amazon S3 è un'interfaccia utente basata sul Web che puoi utilizzare per creare e gestire le risorse nel tuo bucket Amazon S3.
Per caricare utilizzando la console Amazon S3
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Seleziona il link al bucket S3 nel codice DAG nel riquadro S3 per aprire il bucket di archiviazione nella console.
-
Scegli Carica.
-
Scegli Aggiungi file.
-
Seleziona la copia locale del tuo
requirements.txt, scegli Carica.
Installazione delle dipendenze Python nel proprio ambiente
Questa sezione descrive come installare le dipendenze caricate nel bucket Amazon S3 specificando il percorso del file requirements.txt e specificando la versione del file requirements.txt ogni volta che viene aggiornato.
Specificazione del percorso requirements.txt sulla console Amazon MWAA (la prima volta)
Se è la prima volta che crei e carichi un requirements.txt file nel tuo bucket Amazon S3, devi anche specificare il percorso del file sulla console Amazon MWAA. Devi completare questo passaggio solo una volta.
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Scegli Modifica.
-
Nel riquadro del codice DAG di Amazon S3, scegli Browse S3 accanto al file dei requisiti (campo opzionale).
-
Seleziona il
requirements.txtfile nel tuo bucket Amazon S3. -
Scegliere Choose (Scegli).
-
Scegli Avanti, Aggiorna ambiente.
È possibile iniziare a utilizzare i nuovi pacchetti subito dopo il completamento dell'aggiornamento dell'ambiente.
Specificazione della requirements.txt versione sulla console Amazon MWAA
È necessario specificare la versione del requirements.txt file sulla console Amazon MWAA ogni volta che si carica una nuova versione del file requirements.txt nel bucket Amazon S3.
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Scegli Modifica.
-
Nel riquadro del codice DAG di Amazon S3, scegli
requirements.txtuna versione nell'elenco a discesa. -
Scegli Avanti, Aggiorna ambiente.
È possibile iniziare a utilizzare i nuovi pacchetti subito dopo il completamento dell'aggiornamento dell'ambiente.
Accedere ai log per requirements.txt
Puoi visualizzare i log di Apache Airflow per lo scheduler che pianifica i flussi di lavoro e analizza la cartella. dags I passaggi seguenti descrivono come aprire il gruppo di log per lo scheduler sulla console Amazon MWAA e accedere ai log di Apache Airflow sulla console Logs. CloudWatch
Per accedere ai log di un requirements.txt
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Scegli il gruppo di log dello scheduler Airflow nel riquadro Monitoraggio.
-
Scegli il
requirements_install_iplog in Log Streams. -
Fate riferimento all'elenco dei pacchetti che sono stati installati nell'ambiente all'indirizzo
/usr/local/airflow/.local/bin. Ad esempio:Collecting appdirs==1.4.4 (from -r /usr/local/airflow/.local/bin (line 1)) Downloading https://files.pythonhosted.org/packages/3b/00/2344469e2084fb28kjdsfiuyweb47389789vxbmnbjhsdgf5463acd6cf5e3db69324/appdirs-1.4.4-py2.py3-none-any.whl Collecting astroid==2.4.2 (from -r /usr/local/airflow/.local/bin (line 2)) -
Controlla l'elenco dei pacchetti e verifica se qualcuno di questi ha riscontrato un errore durante l'installazione. Se qualcosa è andato storto, viene visualizzato un errore simile al seguente:
2021-03-05T14:34:42.731-07:00 No matching distribution found for LibraryName==1.0.0 (from -r /usr/local/airflow/.local/bin (line 4)) No matching distribution found for LibraryName==1.0.0 (from -r /usr/local/airflow/.local/bin (line 4))
Fasi successive
Testa i tuoi DAGs plugin personalizzati e le dipendenze Python localmente usando on. aws-mwaa-docker-images