Pengumpulan data - AWS Panduan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pengumpulan data

Anda dapat mengumpulkan data dari berbagai sumber dalam AWS, tetapi penting untuk memilih alat pengumpulan data yang tepat untuk kasus penggunaan Anda. Diagram berikut menunjukkan bagaimana tahap pengumpulan data sesuai dengan otomatisasi rekayasa data dan siklus hidup kontrol akses.

Diagram pengumpulan data

AWS menyediakan alat pengumpulan data berikut:

  • Amazon Kinesis membantu Anda mengumpulkan data streaming. Kinesis juga menawarkan kemampuan integrasi dan pemrosesan yang mulus.

  • AWS Database Migration Service (AWS DMS) membantu Anda menyerap data dari database relasional. AWS DMS memiliki opsi konfigurasi dan koneksi langsung antara layanan lokal dan database, seperti Amazon Simple Storage Service (Amazon S3), yang di-host di AWS.

  • AWS Glue adalah alat ekstrak, transformasi, dan muat (ETL) yang membantu Anda menyerap data yang tidak terstruktur.

Ada beberapa kasus penggunaan untuk mengumpulkan data tidak terstruktur atau semi-terstruktur dengan menggunakan Amazon S3 untuk penyimpanan. Misalnya, kasus penggunaan pengumpulan data situs manufaktur dapat memerlukan data historis untuk dicerna untuk data riwayat mesin sebagai file XHTML, data peristiwa sebagai file JSON, dan data pembelian dari database relasional. Kasus penggunaan ini juga dapat mengharuskan ketiga sumber data harus digabungkan.

Sebelum Anda memulai proses konsumsi data, kami sarankan Anda memahami data apa yang harus dicerna, dan kemudian memilih alat yang tepat untuk mengumpulkan data ini.