Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Praktik terbaik untuk ketahanan dan pemantauan jaringan di Amazon MQ untuk RabbitMQ
Ketahanan jaringan dan metrik pialang pemantauan sangat penting untuk memelihara aplikasi perpesanan yang andal. Selesaikan praktik terbaik berikut untuk menerapkan mekanisme pemulihan otomatis dan strategi pemantauan sumber daya.
Langkah 1: Secara otomatis pulih dari kegagalan jaringan
Kami merekomendasikan untuk selalu mengaktifkan pemulihan jaringan otomatis guna mencegah waktu henti yang signifikan ketika koneksi klien ke node RabbitMQ gagal. Pustaka klien RabbitMQ Java mendukung pemulihan jaringan otomatis secara default, dimulai dari versi 4.0.0
.
Dalam kasus ketika koneksi awal antara klien dan node RabbitMQ gagal, pemulihan otomatis tidak akan dipicu. Kami merekomendasikan Anda menulis kode aplikasi untuk memperhitungkan kegagalan koneksi awal dengan mencoba ulang koneksi. Contoh berikut mendemonstrasikan percobaan ulang kegagalan jaringan awal menggunakan pustaka klien RabbitMQ Java.
ConnectionFactory factory = new ConnectionFactory(); // enable automatic recovery if using RabbitMQ Java client library prior to version 4.0.0. factory.setAutomaticRecoveryEnabled(true); // configure various connection settings try { Connection conn = factory.newConnection(); } catch (java.net.ConnectException e) { Thread.sleep(5000); // apply retry logic }
catatan
Jika aplikasi menutup koneksi menggunakan metode Connection.Close
, pemulihan jaringan otomatis tidak akan diaktifkan atau dipicu.
Langkah 2: Pantau metrik dan alarm broker
Kami merekomendasikan pemantauan CloudWatch metrik dan alarm secara teratur untuk Amazon MQ Anda untuk broker RabbitMQ untuk mengidentifikasi dan mengatasi potensi masalah sebelum memengaruhi aplikasi perpesanan Anda. Pemantauan proaktif sangat penting untuk menjaga aplikasi pesan yang tangguh dan memastikan kinerja yang optimal.
Amazon MQ untuk RabbitMQ menerbitkan metrik CloudWatch yang memberikan wawasan tentang kinerja broker, pemanfaatan sumber daya, dan alur pesan. Metrik utama untuk memantau termasuk penggunaan memori dan penggunaan disk. Anda dapat mengatur CloudWatch alarm ketika broker Anda mendekati batas sumber daya atau mengalami penurunan kinerja.
Pantau metrik penting berikut:
RabbitMQMemUsed
danRabbitMQMemLimit
-
Pantau penggunaan memori untuk mencegah alarm memori yang dapat memblokir penerbitan pesan.
RabbitMQDiskFree
danRabbitMQDiskFreeLimit
-
Pantau penggunaan disk untuk menghindari masalah ruang disk yang dapat menyebabkan kegagalan broker.
Untuk penerapan klaster, pantau juga metrik khusus node untuk mengidentifikasi masalah spesifik node.
catatan
Untuk informasi selengkapnya tentang cara mencegah alarm memori tinggi, lihat Alamat dan mencegah alarm memori tinggi.