Apa itu Amazon Data Firehose? - Amazon Data Firehose

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apa itu Amazon Data Firehose?

Amazon Data Firehose adalah layanan yang dikelola sepenuhnya untuk mengirimkan data streaming waktu nyata ke tujuan seperti Amazon Simple Storage Tables, Amazon Redshift, Amazon Redshift, Amazon Serverless, Splunk, Apache Iceberg Tables, dan titik akhir HTTP kustom atau titik akhir HTTP yang dimiliki oleh penyedia OpenSearch layanan pihak ketiga yang didukung, termasuk LogicMonitor Datadog, Dynatrace, MongoDB, New Relic, Coralogix, dan Elastic. OpenSearch Dengan Amazon Data Firehose, Anda tidak perlu menulis aplikasi atau mengelola sumber daya. Anda mengonfigurasi produsen data untuk mengirim data ke Amazon Data Firehose yang akan secara otomatis mengirimkan data ke tujuan yang Anda tentukan. Anda dapat mengonfigurasi Amazon Data Firehose untuk mentransformasi data sebelum mengirimkannya.

Untuk informasi selengkapnya tentang solusi AWS big data, lihat Big Data pada AWS. Untuk informasi selengkapnya tentang solusi data streaming AWS , lihat Apa Itu Data Streaming?

Pelajari konsep-konsep kunci

Saat memulai Amazon Data Firehose, memahami konsep berikut ini dapat bermanfaat bagi Anda.

Aliran Firehose

Entitas dasar dari Amazon Data Firehose. Anda menggunakan Amazon Data Firehose dengan membuat aliran Firehose dan kemudian mengirimkan data ke dalamnya. Untuk informasi selengkapnya, lihat Tutorial: Membuat aliran Firehose dari konsol dan Mengirim data ke aliran Firehose.

catatan

Data penting yang dikirimkan oleh produsen data Anda ke aliran Firehose. Sebuah catatan bisa berukuran sebesar 1.000 KB.

produsen data

Produsen mengirimkan catatan ke aliran Firehose. Misalnya, server web yang mengirimkan data log ke aliran Firehose adalah produsen data. Anda dapat mengonfigurasi aliran Firehose untuk membaca data secara otomatis dari aliran data Kinesis yang ada, dan memasukkannya ke tujuan. Untuk informasi selengkapnya, lihat Mengirim data ke aliran Firehose.

Ukuran buffer dan interval buffer

Amazon Data Firehose menyangga data streaming yang masuk ke ukuran tertentu atau untuk jangka waktu tertentu sebelum mengirimkannya ke tujuan. Buffer Sizemasuk MBs dan Buffer Interval dalam hitungan detik.

Memahami aliran data di Amazon Data Firehose

Untuk tujuan Amazon S3, data streaming dikirim ke bucket S3 Anda. Jika transformasi data diaktifkan, Anda dapat secara opsional mencadangkan data sumber ke bucket Amazon S3 lain.

Diagram yang menunjukkan aliran data Amazon Data Firehose untuk Amazon S3.

Untuk tujuan Amazon Redshift, data streaming dikirim ke bucket S3 Anda. Amazon Data Firehose kemudian mengeluarkan perintah Amazon COPY Redshift untuk memuat data dari bucket S3 ke klaster Amazon Redshift Anda. Jika transformasi data diaktifkan, Anda dapat secara opsional mencadangkan data sumber ke bucket Amazon S3 lain.

Diagram yang menunjukkan aliran data Amazon Data Firehose untuk Amazon Redshift.

Untuk tujuan OpenSearch Layanan, data streaming dikirim ke klaster OpenSearch Layanan Anda, dan secara opsional dapat dicadangkan ke bucket S3 Anda secara bersamaan.

Diagram yang menunjukkan aliran data Amazon Data Firehose untuk OpenSearch Service.

Untuk tujuan Splunk, data streaming dikirim ke Splunk, dan secara opsional dapat dicadangkan ke bucket S3 Anda secara bersamaan.

Diagram yang menunjukkan aliran data Amazon Data Firehose untuk Splunk.