Apa Alur Kerja yang Dikelola Amazon untuk Apache Airflow? - Amazon Managed Workflows for Apache Airflow

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apa Alur Kerja yang Dikelola Amazon untuk Apache Airflow?

Gunakan Alur Kerja Terkelola Amazon untuk Apache Airflow, layanan terkelola untuk Apache Airflow, untuk menyiapkan dan menjalankan pipeline data di cloud dalam skala besar. Apache Airflow adalah alat sumber terbuka yang digunakan untuk membuat, menjadwalkan, dan memantau alur kerja.

Dengan Amazon MWAA, Anda dapat menggunakan Apache Airflow dan Python untuk membuat alur kerja tanpa mengelola infrastruktur untuk skalabilitas, ketersediaan, dan keamanan. Amazon MWAA secara otomatis menskalakan untuk memenuhi kebutuhan alur kerja Anda. Ini terintegrasi dengan layanan AWS keamanan untuk menyediakan akses cepat dan aman ke data Anda.

Fitur

Tinjau fitur-fitur berikut untuk mempelajari bagaimana Amazon MWAA dapat menyederhanakan pengelolaan alur kerja Apache Airflow Anda.

Arsitektur

Semua komponen yang terdapat di kotak luar (pada gambar berikut) ditampilkan sebagai lingkungan Amazon MWAA tunggal di akun Anda. Penjadwal dan pekerja Apache Airflow AWS Fargate adalah wadah yang terhubung ke subnet pribadi di VPC Amazon untuk lingkungan Anda. Setiap lingkungan memiliki metadatabase Apache Airflow sendiri yang dikelola AWS oleh yang dapat diakses oleh penjadwal dan pekerja kontainer Fargate melalui titik akhir VPC yang diamankan secara pribadi.

Amazon CloudWatch, Amazon S3, Amazon SQS, AWS KMS dan terpisah dari Amazon MWAA dan harus dapat diakses dari penjadwal dan pekerja Apache Airflow di wadah Fargate. Beberapa penjadwal Apache Airflow hanya tersedia dengan Apache Airflow v2 dan yang lebih baru. Pelajari lebih lanjut tentang siklus hidup tugas Apache Airflow di Concepts dalam panduan referensi Apache Airflow.

Server web Apache Airflow dapat diakses baik melalui internet dengan memilih mode akses Apache Airflow jaringan Publik, atau dalam VPC Anda dengan memilih mode akses Apache Airflow jaringan Pribadi. Dalam kedua kasus tersebut, akses untuk pengguna Apache Airflow Anda dikontrol oleh kebijakan kontrol akses yang Anda tentukan AWS Identity and Access Management (IAM).

catatan

Dimulai dengan Apache Airflow v3, server web Amazon MWAA juga menghosting server API eksekusi Apache Airflow.

Arsitektur lingkungan Amazon MWAA.

Integrasi

Komunitas open-source Apache Airflow yang aktif dan berkembang menyediakan operator (plugin yang menyederhanakan koneksi ke layanan) untuk Apache Airflow untuk diintegrasikan dengan layanan. AWS Ini termasuk layanan seperti Amazon S3, Amazon Redshift, Amazon AWS Batch EMR, SageMaker dan Amazon AI, serta layanan di platform cloud lainnya.

Menggunakan Apache Airflow dengan Amazon MWAA sepenuhnya mendukung AWS integrasi dengan layanan dan alat pihak ketiga yang populer seperti Apache Hadoop, Presto, Hive, dan Spark untuk melakukan tugas pemrosesan data. Amazon MWAA berkomitmen untuk menjaga kompatibilitas dengan Apache Airflow API, dan Amazon MWAA bermaksud untuk menyediakan AWS integrasi yang andal ke layanan dan membuatnya tersedia bagi komunitas, dan terlibat dalam pengembangan fitur komunitas.

Untuk kode sampel, lihatContoh kode untuk Alur Kerja Terkelola Amazon untuk Apache Airflow.

Versi yang didukung

Amazon MWAA mendukung beberapa versi Apache Airflow. Untuk informasi lebih lanjut tentang versi Apache Airflow yang kami dukung dan komponen Apache Airflow yang disertakan dengan setiap versi, lihat. Versi Apache Airflow di Amazon Managed Workflows for Apache Airflow

Apa selanjutnya?