Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Apa Alur Kerja yang Dikelola Amazon untuk Apache Airflow?
Gunakan Alur Kerja Terkelola Amazon untuk Apache Airflow, layanan terkelola untuk Apache Airflow
Dengan Amazon MWAA, Anda dapat menggunakan Apache Airflow dan Python untuk membuat alur kerja tanpa mengelola infrastruktur untuk skalabilitas, ketersediaan, dan keamanan. Amazon MWAA secara otomatis menskalakan untuk memenuhi kebutuhan alur kerja Anda. Ini terintegrasi dengan layanan AWS keamanan untuk menyediakan akses cepat dan aman ke data Anda.
Fitur
Tinjau fitur-fitur berikut untuk mempelajari bagaimana Amazon MWAA dapat menyederhanakan pengelolaan alur kerja Apache Airflow Anda.
-
Pengaturan Aliran Udara Otomatis - Siapkan Apache Airflow dengan cepat dengan memilih versi Apache Airflow saat Anda membuat lingkungan Amazon MWAA. Amazon MWAA menyiapkan Apache Airflow untuk Anda menggunakan antarmuka pengguna Apache Airflow yang sama dan kode sumber terbuka yang tersedia di internet.
-
Penskalaan otomatis — Secara otomatis menskalakan pekerja Apache Airflow (sumber daya komputasi yang menjalankan tugas Anda) dengan menetapkan batas minimum dan maksimum. Amazon MWAA memantau pekerja di lingkungan Anda dan menggunakan komponen penskalaan otomatisnya untuk menambahkan pekerja guna memenuhi permintaan, hingga jumlah maksimum yang Anda tentukan.
-
Otentikasi bawaan — Aktifkan otentikasi dan otorisasi berbasis peran untuk server web Apache Airflow Anda dengan mendefinisikan kebijakan kontrol akses di (IAM). AWS Identity and Access Management Pekerja Apache Airflow mengasumsikan kebijakan ini untuk akses aman ke layanan. AWS
-
Keamanan bawaan - Pekerja dan penjadwal Apache Airflow berjalan di Amazon VPC Amazon MWAA Amazon. Data juga dienkripsi secara otomatis menggunakan AWS Key Management Service, sehingga lingkungan Anda aman secara default.
-
Mode akses publik atau pribadi — Akses server web Apache Airflow Anda menggunakan mode akses pribadi atau publik. Mode akses jaringan Publik menggunakan titik akhir VPC untuk server web Apache Airflow Anda yang dapat diakses melalui internet. Mode akses jaringan pribadi menggunakan titik akhir VPC untuk server web Apache Airflow Anda yang dapat diakses di VPC Anda. Dalam kedua kasus tersebut, akses untuk pengguna Apache Airflow Anda dikontrol oleh kebijakan kontrol akses yang Anda tentukan AWS Identity and Access Management (IAM), dan SSO. AWS
-
Peningkatan dan tambalan yang disederhanakan - Amazon MWAA menyediakan versi baru Apache Airflow secara berkala. Tim Amazon MWAA akan memperbarui dan menambal gambar untuk versi ini.
-
Pemantauan alur kerja — akses log Apache Airflow dan metrik Apache Airflow di CloudWatch Amazon untuk mengidentifikasi penundaan tugas Apache Airflow atau kesalahan alur kerja tanpa memerlukan alat pihak ketiga tambahan. Amazon MWAA secara otomatis mengirimkan metrik lingkungan—dan jika diaktifkan—log Apache Airflow ke. CloudWatch
-
AWS integrasi - Amazon MWAA mendukung integrasi sumber terbuka dengan Amazon Athena,, Amazon AWS Batch, Amazon CloudWatch DynamoDB,, Amazon AWS DataSync EMR, Amazon EKS, AWS Fargate Amazon Data Firehose,, Amazon AWS Glue AWS Lambda Redshift, Amazon SQS, Amazon SNS, Amazon AI, dan Amazon S3, serta ratusan operator dan sensor bawaan dan dibuat SageMaker komunitas.
-
Armada pekerja — Amazon MWAA menawarkan dukungan untuk menggunakan kontainer untuk meningkatkan skala armada pekerja sesuai permintaan dan mengurangi pemadaman penjadwal menggunakan Amazon ECS. AWS Fargate Operator yang menjalankan tugas di container Amazon ECS, dan operator Kubernetes yang membuat dan menjalankan pod pada klaster Kubernetes didukung.
Arsitektur
Semua komponen yang terdapat di kotak luar (pada gambar berikut) ditampilkan sebagai lingkungan Amazon MWAA tunggal di akun Anda. Penjadwal dan pekerja Apache Airflow AWS Fargate adalah wadah yang terhubung ke subnet pribadi di VPC Amazon untuk lingkungan Anda. Setiap lingkungan memiliki metadatabase Apache Airflow sendiri yang dikelola AWS oleh yang dapat diakses oleh penjadwal dan pekerja kontainer Fargate melalui titik akhir VPC yang diamankan secara pribadi.
Amazon CloudWatch, Amazon S3, Amazon SQS, AWS KMS dan terpisah dari Amazon MWAA dan harus dapat diakses dari penjadwal dan pekerja Apache Airflow di wadah Fargate. Beberapa penjadwal Apache Airflow hanya tersedia dengan Apache Airflow v2 dan yang lebih baru. Pelajari lebih lanjut tentang siklus hidup tugas Apache Airflow di Concepts dalam
Server web Apache Airflow dapat diakses baik melalui internet dengan memilih mode akses Apache Airflow jaringan Publik, atau dalam VPC Anda dengan memilih mode akses Apache Airflow jaringan Pribadi. Dalam kedua kasus tersebut, akses untuk pengguna Apache Airflow Anda dikontrol oleh kebijakan kontrol akses yang Anda tentukan AWS Identity and Access Management (IAM).
catatan
Dimulai dengan Apache Airflow v3, server web Amazon MWAA juga menghosting server API eksekusi Apache Airflow.
Integrasi
Komunitas open-source Apache Airflow yang aktif dan berkembang menyediakan operator (plugin yang menyederhanakan koneksi ke layanan) untuk Apache Airflow untuk diintegrasikan dengan layanan. AWS Ini termasuk layanan seperti Amazon S3, Amazon Redshift, Amazon AWS Batch EMR, SageMaker dan Amazon AI, serta layanan di platform cloud lainnya.
Menggunakan Apache Airflow dengan Amazon MWAA sepenuhnya mendukung AWS integrasi dengan layanan dan alat pihak ketiga yang populer seperti Apache Hadoop, Presto, Hive, dan Spark untuk melakukan tugas pemrosesan data. Amazon MWAA berkomitmen untuk menjaga kompatibilitas dengan Apache Airflow API, dan Amazon MWAA bermaksud untuk menyediakan AWS integrasi yang andal ke layanan dan membuatnya tersedia bagi komunitas, dan terlibat dalam pengembangan fitur komunitas.
Untuk kode sampel, lihatContoh kode untuk Alur Kerja Terkelola Amazon untuk Apache Airflow.
Versi yang didukung
Amazon MWAA mendukung beberapa versi Apache Airflow. Untuk informasi lebih lanjut tentang versi Apache Airflow yang kami dukung dan komponen Apache Airflow yang disertakan dengan setiap versi, lihat. Versi Apache Airflow di Amazon Managed Workflows for Apache Airflow
Apa selanjutnya?
-
Mulailah dengan satu AWS CloudFormation templat yang membuat bucket Amazon S3 untuk Airflow DAGs dan file pendukung Anda, VPC Amazon dengan perutean publik, dan lingkungan Amazon MWAA di dalamnya. Tutorial mulai cepat untuk Alur Kerja Terkelola Amazon untuk Apache Airflow
-
Mulailah secara bertahap dengan membuat bucket Amazon S3 untuk DAGs Airflow dan file pendukung Anda, memilih salah satu dari tiga opsi jaringan VPC Amazon, dan menciptakan lingkungan Amazon MWAA di dalamnya. Memulai dengan Amazon Managed Workflows for Apache Airflow