Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Luncurkan cluster ke dalam VPC dengan Amazon EMR
Setelah Anda memiliki subnet yang dikonfigurasi untuk menghosting klaster Amazon EMR, luncurkan klaster di subnet tersebut dengan menetapkan pengenal subnet terkait saat membuat klaster.
catatan
Amazon EMR mendukung subnet privat dalam versi rilis 4.2 dan di atasnya.
Saat klaster diluncurkan, Amazon EMR menambahkan grup keamanan yang didasarkan pada apakah klaster diluncurkan ke subnet privat atau publik VPC. Semua grup keamanan mengizinkan ingress pada port 8443 guna berkomunikasi ke layanan Amazon EMR, tetapi rentang alamat IP berbeda-beda untuk subnet publik dan privat. Amazon EMR mengelola semua grup keamanan ini, dan mungkin perlu menambahkan alamat IP tambahan ke AWS rentang dari waktu ke waktu. Untuk informasi selengkapnya, lihat Kontrol lalu lintas jaringan dengan grup keamanan untuk klaster EMR Amazon Anda.
Untuk mengelola cluster pada VPC, Amazon EMR melampirkan perangkat jaringan ke node utama dan mengelolanya melalui perangkat ini. Anda dapat melihat perangkat ini menggunakan tindakan Amazon EC2 API DescribeInstances
. Jika Anda mengubah perangkat ini dengan cara apapun, klaster dapat mengalami kegagalan.
Memastikan alamat IP yang tersedia untuk kluster EMR EC2
Untuk memastikan bahwa subnet dengan alamat IP gratis yang cukup tersedia saat Anda meluncurkan, pemilihan EC2 subnet memeriksa ketersediaan IP. Proses pembuatan menggunakan subnet dengan jumlah alamat IP yang diperlukan untuk meluncurkan node inti, primer dan tugas seperti yang diperlukan, bahkan jika pada pembuatan awal, hanya node inti untuk cluster yang dibuat. EMR memeriksa jumlah alamat IP yang diperlukan untuk meluncurkan node primer dan tugas selama pembuatan, serta menghitung secara terpisah jumlah alamat IP yang diperlukan untuk meluncurkan node inti. Jumlah minimum instance atau node primer dan tugas yang diperlukan ditentukan secara otomatis oleh Amazon EMR.
penting
Jika tidak ada subnet di VPC yang cukup IPs tersedia untuk mengakomodasi node penting, kesalahan akan dikembalikan dan cluster tidak dibuat.
Dalam sebagian besar kasus penerapan, ada perbedaan waktu antara setiap peluncuran node inti, primer, dan tugas. Selain itu, dimungkinkan untuk beberapa cluster untuk berbagi subnet. Dalam kasus ini, ketersediaan alamat IP dapat berfluktuasi dan peluncuran node tugas berikutnya, misalnya, dapat dibatasi oleh alamat IP yang tersedia.