Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Praktik terbaik untuk Amazon OpenSearch Ingestion
Topik ini memberikan praktik terbaik untuk membuat dan mengelola saluran Amazon OpenSearch Ingestion dan mencakup pedoman umum yang berlaku untuk banyak kasus penggunaan. Setiap beban kerja unik, dengan karakteristik unik, jadi tidak ada rekomendasi umum yang tepat untuk setiap kasus penggunaan.
Praktik terbaik umum
Praktik terbaik umum berikut berlaku untuk membuat dan mengelola jaringan pipa.
-
Untuk memastikan ketersediaan tinggi, konfigurasikan pipeline VPC dengan dua atau tiga subnet. Jika Anda hanya menerapkan pipeline di satu subnet dan Availability Zone turun, Anda tidak akan dapat menyerap data.
-
Dalam setiap pipa, kami sarankan untuk membatasi jumlah sub-pipeline menjadi 5 atau kurang.
-
Jika Anda menggunakan plugin sumber S3, gunakan file S3 berukuran merata untuk kinerja optimal.
-
Jika Anda menggunakan plugin sumber S3, tambahkan 30 detik batas waktu visibilitas tambahan untuk setiap ukuran file 0,25 GB di bucket S3 untuk kinerja optimal.
-
Sertakan antrian surat mati
(DLQ) dalam konfigurasi pipeline sehingga Anda dapat membongkar peristiwa yang gagal dan membuatnya dapat diakses untuk dianalisis. Jika sink Anda menolak data karena pemetaan yang salah atau masalah lain, Anda dapat merutekan data ke DLQ untuk memecahkan masalah dan memperbaiki masalah.
CloudWatch Alarm yang Direkomendasikan
CloudWatch Alarm melakukan tindakan bila CloudWatch metrik melebihi nilai tertentu selama beberapa waktu. Misalnya, Anda mungkin ingin AWS untuk mengirim email kepada Anda jika status kesehatan klaster Anda lebih dari satu menit. red
Bagian ini mencakup beberapa alarm yang direkomendasikan untuk Amazon OpenSearch Ingestion dan bagaimana menanggapinya.
Untuk informasi selengkapnya tentang mengonfigurasi alarm, lihat Membuat CloudWatchAlarm Amazon di Panduan Pengguna Amazon CloudWatch .
Alarm | Isu |
---|---|
|
Pipa telah mencapai kapasitas maksimum dan mungkin memerlukan maxUnits pembaruan. Tingkatkan kapasitas maksimum pipa Anda |
|
Pipa tidak dapat menulis ke OpenSearch wastafel. Periksa izin pipeline dan konfirmasikan bahwa domain atau koleksinya sehat. Anda juga dapat memeriksa antrian huruf mati (DLQ) untuk peristiwa yang gagal, jika sudah dikonfigurasi. |
|
Pipa mengalami latensi tinggi mengirim data ke OpenSearch wastafel. Ini kemungkinan karena wastafel berukuran terlalu kecil, atau strategi sharding yang buruk, yang menyebabkan wastafel tertinggal. Latensi tinggi yang berkelanjutan dapat memengaruhi kinerja pipa dan kemungkinan akan menyebabkan tekanan balik pada klien. |
|
Permintaan konsumsi tidak diautentikasi. Konfirmasikan bahwa semua klien memiliki otentikasi Signature Version 4 yang diaktifkan dengan benar. |
|
Penggunaan CPU yang tinggi dapat menjadi masalah. Pertimbangkan untuk meningkatkan kapasitas maksimum untuk pipa. |
|
Penggunaan buffer tinggi yang berkelanjutan bisa menjadi masalah. Pertimbangkan untuk meningkatkan kapasitas maksimum untuk pipa. |
Alarm lain yang mungkin Anda pertimbangkan
Pertimbangkan untuk mengonfigurasi alarm berikut tergantung pada fitur Amazon OpenSearch Ingestion yang biasa Anda gunakan.
Alarm | Isu |
---|---|
|
Upaya untuk memicu ekspor ke Amazon S3 gagal. |
|
EndtoEndLatency Lebih tinggi dari yang diinginkan untuk membaca dari aliran DynamoDB. Hal ini dapat disebabkan oleh OpenSearch cluster underscaled atau kapasitas OCU pipeline maksimum yang terlalu rendah untuk throughput WCU pada tabel DynamoDB. EndtoEndLatency akan lebih tinggi setelah ekspor tetapi akan berkurang seiring waktu karena mengikuti aliran DynamoDB terbaru. |
|
Tidak ada catatan yang dikumpulkan dari aliran DynamoDB. Ini bisa disebabkan oleh tidak adanya aktivitas di atas meja, atau masalah saat mengakses aliran DynamoDB. |
|
Sejumlah besar catatan dikirim ke DLQ daripada wastafel. OpenSearch Tinjau metrik plugin OpenSearch sink untuk menyelidiki dan menentukan akar penyebabnya. |
|
Semua data habis waktu sementara prosesor Grok mencoba mencocokkan pola. Ini kemungkinan berdampak pada kinerja dan memperlambat pipeline Anda. Pertimbangkan untuk menyesuaikan pola Anda untuk mengurangi batas waktu. |
|
Prosesor Grok gagal mencocokkan pola dengan data dalam pipeline, yang mengakibatkan kesalahan. Tinjau data Anda dan konfigurasi plugin Grok untuk memastikan pencocokan pola diharapkan. |
|
Prosesor Grok tidak dapat mencocokkan pola dengan data dalam pipeline. Tinjau data Anda dan konfigurasi plugin Grok untuk memastikan pencocokan pola diharapkan. |
|
Prosesor Tanggal tidak dapat mencocokkan pola apa pun dengan data dalam pipeline. Tinjau data Anda dan konfigurasi plugin Tanggal untuk memastikan pola yang diharapkan. |
|
Masalah ini terjadi karena objek S3 tidak ada, atau pipeline memiliki hak istimewa yang tidak mencukupi. Reivew s3ObjectsNotFound.count dan s3ObjectsAccessDenied.count metrik untuk menentukan akar penyebabnya. Konfirmasikan bahwa objek S3 ada dan/atau perbarui izin. |
|
Plugin S3 gagal memproses pesan Amazon SQS. Jika DLQ diaktifkan pada antrean SQS Anda, tinjau pesan yang gagal. Antrian mungkin menerima data tidak valid yang coba diproses oleh pipeline. |
|
Klien mengirim permintaan yang buruk. Konfirmasikan bahwa semua klien mengirimkan muatan yang tepat. |
|
Permintaan dari plugin sumber HTTP berisi terlalu banyak data, yang melebihi kapasitas buffer. Sesuaikan ukuran batch untuk klien Anda. |
|
Plugin sumber HTTP mengalami kesulitan menerima acara. |
|
Batas waktu sumber kemungkinan merupakan hasil dari pipeline yang kurang tersedia. Pertimbangkan untuk meningkatkan pipa maxUnits untuk menangani beban kerja tambahan. |
|
Klien mengirim permintaan yang buruk. Konfirmasikan bahwa semua klien mengirimkan muatan yang tepat. |
|
Permintaan dari plugin sumber Otel Trace berisi terlalu banyak data, yang melebihi kapasitas buffer. Sesuaikan ukuran batch untuk klien Anda. |
|
Plugin sumber Otel Trace mengalami kesulitan menerima acara. |
|
Batas waktu sumber kemungkinan merupakan hasil dari pipeline yang kurang tersedia. Pertimbangkan untuk meningkatkan pipa maxUnits untuk menangani beban kerja tambahan. |
|
Batas waktu sumber kemungkinan merupakan hasil dari pipeline yang kurang tersedia. Pertimbangkan untuk meningkatkan pipa maxUnits untuk menangani beban kerja tambahan. |